ЦиСин Цзэсянь: DeepSeek следующий поколение новой модели, вероятно, продолжит линию высокоэффективных открытых моделей

CryptocurrencySniper · 2026-04-01T03:47:13+00:00

Отчет CITIC Securities отмечает, что отечественные производители крупных моделей сосредоточатся на обновлении возможностей агента и кода. Новая модель DeepSeek, которая скоро будет выпущена, обещает улучшить функции памяти и обработки контекста, а также открывает новые инвестиционные возможности для производителей моделей, AI-приложений и инфраструктуры. Снижение стоимости моделей увеличит глобальный объем API-запросов, способствуя внедрению AI-приложений и развитию инфраструктуры.

CryptocurrencySniper

2026-04-01 03:47:13

Генерация тезисов в процессе

Согласно исследовательскому отчету CITIC Securities, начиная с 2026 года китайские производители отечественных больших моделей сосредотачиваются на обновлении возможностей Agent и кода, соревнуясь в выпуске новых моделей. Ожидается, что анонсируемая следующая модель DeepSeek продолжит линию высокорентабельных открытых моделей: по функциональности она сможет обеспечить более сильные возможности запоминания и обработку сверхдлинного контекста, а также, совершенствуя навыки кода и Agent, одновременно устранит слабые места в мультимодальности, создав новые возможности для инвестиций в направлениях модельных вендоров, AI-приложений и AI базовой инфраструктуры.

1、модельные вендоры: следующая модель DeepSeek, как ожидается, сможет идти в тандеме с другими отечественными моделями, ускоряя движение китайского AI к миру; при этом продвижение обучения модели позволит дополнительно снизить издержки, а более дешевые tokens будут в целом увеличивать общий объем вызовов API глобальных больших моделей. 2、AI-приложения: равноправие моделей помогает снизить тревогу рынка, вызванную нарративом о противоречии между моделями и приложениями; способствует внедрению AI Agent во все отрасли и направления; благоприятно для AI-компаний с барьерами. 3、AI базовая инфраструктура: снижение затрат ведет к росту объема использования, от чего выигрывает AI Infra; отечественная AI Infra и отечественные модели движутся навстречу друг другу.

Полный текст выглядит следующим образом

Компьютеры｜DeepSeek: прогноз по следующему поколению моделей

Начиная с 2026 года производители отечественных больших моделей фокусируются на модернизации возможностей Agent и кода, соревнуясь в выпуске новых моделей. Мы считаем, что следующая модель DeepSeek, которую ожидается выпустить вскоре, вероятно продолжит линию высокорентабельных открытых моделей: по функциональности она сможет обеспечить более сильные возможности запоминания и обработку сверхдлинного контекста, а также, совершенствуя способности кода и Agent, одновременно устранит слабые места в мультимодальности, создавая новые возможности для инвестиций в направлениях модельных вендоров, AI-приложений и AI базовой инфраструктуры.

▍ код, Agent и нативная мультимодальность: направления обновления глобальных больших моделей.

В области AI-программирования обновление тренировочных фреймворков, использование целых кодовых репозиториев и инженерных следов как тренировочных данных, а также введение более глубоких chain of thought с многозадачным исполнением и самовосстановлением приводят к тому, что AI Coding продвигается от инструментов для подстановки кода к автономным интеллектуальным агентам уровня проекта. Harness Engineer, как ожидается, позволит техническим специалистам перейти от роли инженера по коду к роли менеджера Agent, чтобы AI мог реализовать максимальную эффективность. В сфере кластеров из нескольких Agent наглядно демонстрируется потенциал многоагентных систем на примере продукта OpenClaw, стоящего на уровне «феноменального»; такие компании, как Zhipu, MiniMax, Tencent, Kimi и др., выпустили продукты «по типу лобстера», высвобождая производительность цифровых сотрудников. В области нативной мультимодальности нативная мультимодальная архитектура уже стала основным направлением; гибридное кодирование с быстрым прорывом встраивания (embedding) по-прежнему требует дальнейших прорывов в ключевых этапах, таких как интерактивное взаимодействие в реальном времени с аудио/видео и сквозное мультимодальное непрерывное рассуждение.

▍ Отечественные большие модели: плотные итерации и постоянные прорывы в возможностях.

1）MiniMax: возможности кода получают дальнейшее обновление; результат теста M2.7 SWE-Pro — 56.22%, что выше, чем у Gemini 3.1 Pro; в сценарии тестирования VIBE-Pro по полностью сквозной поставке завершенного проекта на end-to-end уровне балл составляет 55.6%, наравне с Claude Opus 4.6, а понимание логики работы программных систем дополнительно усиливается. При этом модели серии M2 участвуют в процессе обучения M2.7 в таких сценариях, как RL, реализуя самосовершенствование модели.

2）Zhipu: GLM-5 внедряет DSA и собственную архитектуру «Slime», которая позволяет с минимальным вмешательством человека автономно завершать системно-инженерные задачи, включая долгосрочное планирование и выполнение Agentic, реконструкцию бэкенда и глубокую отладку; при этом в возможностях вызова инструментов и выполнения многошаговых задач (MCP-Atlas 67.8%), сетевого поиска и понимания информации (Browse Comp 89.7%) она приближается и даже превосходит уровень зарубежных ведущих моделей.

3）Kimi: Kimi 2.5 вводит визуальные способности для автоматического разбиения логики взаимодействия, воспроизведения кода; в дополнение была представлена новая модель режима кластеров Agent. В собранных тестах интеллектуальных прикладных сценариев, таких как HLE-Full, BrowseComp, DeepSearchQA, получены баллы, сопоставимые с GPT-5.2, Claude 4.5 Opus и Gemini 3 Pro. Moonshoot применяет стратегию снижения цен: по сравнению с тарифом K2 Turbo цена API снижена более чем на 30%.

4）Xiaomi: Xiaomi MiMo-V2-Pro в тестовых наборах, измеряющих возможности вызова моделей Agent, таких как ClawEval и t2-bench, близка и даже превосходит часть некоторых зарубежных топ-моделей. Ее ранняя внутренняя тестовая версия с анонимным кодовым названием Hunter Alpha была запущена на OpenRouter; в период запуска несколько дней подряд поднималась на первое место в ежедневном чарте по объему вызовов. Мы ожидаем, что «базовая платформа больших моделей» позволит Xiaomi охватить всю экосистему «люди-люди и машины» и «весь семейный IoT-ландшафт», обеспечивая скачок в возможностях AI.

▍ Прогноз по DeepSeek: продолжение линии высокой рентабельности, совершенствование возможностей длинных текстов, кода, Agent и мультимодальности.

DeepSeek выпустила DeepSeek V3.2 в январе 26 года; модель использует архитектуру sparse attention (DSA) + Mixture of Experts (MoE), реализуя повышение эффективности и снижение издержек на этапе обучения и вывода, при этом цены на входные/выходные tokens снижаются на 60%/75% соответственно. Одновременно существенно повышаются баллы в бенчмарках по коду и много-Agent способностям. В сочетании с направлением эволюции моделей DeepSeek и научной статьей по модулю Engram, в которой участвовал Liang Wenfeng (Лян Вэньфэн), мы считаем, что новые модели следующего поколения, такие как DeepSeek V4.0, смогут встраивать Engram в уже зрелую архитектуру DSA+MoE: за счет многоуровневого хранения ключевой часто используемой информации будет происходить экспоненциальное снижение вычислительной нагрузки внимания в слоях Transformer; в результате становится возможной обработка сверхдлинного контекста. При этом, повышая эффективность модели, она будет совершенствовать способности кода и Agent и закрывать слабые места в мультимодальности.

▍ Факторы риска:

Развитие ключевых AI-технологий и расширение применения не оправдают ожиданий; снижение издержек вычислительных мощностей (вычислительных ресурсов) не оправдает ожиданий; неправильное использование AI приведет к серьезным социальным последствиям; риски безопасности данных; риски информационной безопасности; усиление отраслевой конкуренции.

▍ Инвестиционная стратегия: мы рекомендуем обратить внимание на следующие три основные линии инвестиций.

1）Модельные вендоры: следующая модель DeepSeek, как ожидается, сможет идти в тандеме с другими отечественными моделями, ускоряя движение китайского AI к миру; при этом продвижение обучения модели позволит дополнительно снизить издержки, а более дешевые tokens будут в целом увеличивать общий объем вызовов API глобальных больших моделей.

2）AI-приложения: равноправие моделей помогает снизить тревогу рынка, вызванную нарративом о противоречии между моделями и приложениями; способствует внедрению AI Agent во все отрасли; благоприятно для AI-компаний с барьерами;

3）AI базовая инфраструктура: снижение затрат ведет к росту объема использования, от чего выигрывает AI Infra; отечественная AI Infra и отечественные модели движутся навстречу друг другу.

（Источник: Yicai Finance）

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .