ЦиСин Цзэсянь: DeepSeek следующий поколение новой модели, вероятно, продолжит линию высокоэффективных открытых моделей

robot
Генерация тезисов в процессе

Согласно исследовательскому отчету CICC Securities, начиная с 2026 года китайские производители отечественных больших моделей сосредоточиваются на обновлении возможностей Agent и работы с кодом, соревнуясь в выпуске новых моделей. Мы считаем, что ожидаемая к релизу следующая генерация моделей DeepSeek, вероятно, продолжит маршрут высокоценного открытого кода; в плане возможностей она сможет обеспечить более сильные функции запоминания и обработку сверхдлинных контекстов, а также, совершенствуя навыки работы с кодом и Agent, одновременно восполнит слабые места в мультимодальности, открывая новые инвестиционные возможности в направлениях производителя моделей, AI-приложений и AI-инфраструктуры.

1)Производитель моделей: следующая генерация моделей DeepSeek, как ожидается, сможет объединиться с другими отечественными моделями, ускоряя продвижение китайского AI к миру; при этом обучение модели будет продвигаться, снижая себестоимость еще на один шаг, а более дешевые tokens будут в целом увеличивать глобальный объем вызовов API для больших моделей. 2)AI-приложения: равноправие моделей помогает снять беспокойство рынка, вызванное нарративом о противоречиях между моделями и приложениями; способствует внедрению AI Agent во всех отраслях и во многих сегментах, что позитивно для AI-компаний с барьерами. 3)AI-инфраструктура: снижение себестоимости приводит к росту объемов использования, от чего выигрывает AI Infra; отечественная AI Infra движется навстречу отечественным моделям.

Весь текст ниже

Компьютеры|DeepSeek:прогноз следующей генерации моделей

Начиная с 2026 года китайские производители отечественных больших моделей сосредоточиваются на обновлении возможностей Agent и работы с кодом, соревнуясь в выпуске новых моделей. Мы считаем, что ожидаемая к релизу следующая генерация моделей DeepSeek, вероятно, продолжит маршрут высокоценного открытого кода; в плане возможностей она сможет обеспечить более сильные функции запоминания и обработку сверхдлинных контекстов, а также, совершенствуя навыки работы с кодом и Agent, одновременно восполнит слабые места в мультимодальности, открывая новые инвестиционные возможности в направлениях производителя моделей, AI-приложений и AI-инфраструктуры.

Код, Agent и нативная мультимодальность: направления апгрейда глобальных больших моделей.

В области AI-программирования обновление обучающих фреймворков, использование полного репозитория кода и инженерных следов (траекторий) в качестве обучающих данных, а также внедрение более глубокой цепочки размышлений с многошаговым выполнением и самоисправлением создают переход AI Coding от инструментов дополнения кода к проектным автономным интеллектуальным агентам; Harness Engineer, как ожидается, позволит техникам сместиться от роли код-инженера к роли менеджера Agent, который обеспечивает максимальную эффективность, с которой AI реализует свои возможности. В сфере кластеров из множества Agent продукты уровня феномена, такие как OpenClaw, достаточно убедительно демонстрируют потенциал систем с множеством Agent; Zhipu, MiniMax, Tencent, Kimi и другие отечественные вендоры также выпустили продукты «в стиле “креветок-драконов”», раскрывая производительность цифровых сотрудников. В области нативной мультимодальности нативная мультимодальная архитектура уже стала мейнстримом: гибридное кодирование с быстрой смешанной встраиваемостью быстро прорывается вперед; при этом отечественным моделям в ключевых этапах, таких как интерактивность в реальном времени аудио/видео и кросс-модальное непрерывное рассуждение, все еще предстоит совершить прорыв.

▍ Отечественные большие модели: плотные итерации и непрерывные прорывы в возможностях.

1)MiniMax: возможности в области кода получили дальнейшее обновление; результат теста M2.7 SWE-Pro составил 56.22%, превысив Gemini 3.1 Pro; в сценариях тестирования VIBE-Pro, где реализована сквозная доставка полноценного проекта, результат — 55.6%, на уровне Claude Opus 4.6, что дополнительно усиливает понимание логики работы программных систем. Кроме того, модели серии M2 участвовали в процессе обучения M2.7 в таких сценариях, как RL, реализуя самоповторяющуюся итерацию модели.

2)Zhipu: GLM-5 внедряет DSA и собственную архитектуру «Slime»; она позволяет с минимальным вмешательством человека автономно выполнять системные инженерные задачи, включая Agentic долгосрочное планирование и исполнение, рефакторинг (перестройку) бэкенда и глубокую отладку. Возможности в вызовах инструментов и многошаговом выполнении задач (MCP-Atlas 67.8%), а также в сетевом поиске и понимании информации (Browse Comp 89.7%) приближаются к уровню или даже превосходят показатели зарубежных ведущих моделей.

3)Kimi: Kimi 2.5 внедрил визуальные возможности — автоматическое разложение логики взаимодействия, воспроизведение кода; также в ней введен новый режим кластера Agent. В центрах тестирования агентных приложений, таких как HLE-Full, BrowseComp, DeepSearchQA, были получены баллы, сопоставимые с GPT-5.2, Claude 4.5 Opus и Gemini 3 Pro. Moonshoot использует стратегию снижения цены: API-цена по сравнению с тарифом K2 Turbo снижена более чем на 30%.

4)Xiaomi: Xiaomi MiMo-V2-Pro в тестовых наборах по оценке возможностей Agent при вызовах моделей, таких как ClawEval и t2-bench, приближается к уровню или даже превосходит часть зарубежных топ-моделей; ее ранние внутренние тестовые версии были выпущены под анонимным кодовым названием Hunter Alpha и запущены на OpenRouter; в период релиза несколько дней подряд занимала верхние позиции в ежедневном рейтинге по объему вызовов. Мы ожидаем, что «платформа» больших моделей будет поддерживать весь экосистемный контур Xiaomi «человек-автомобиль-дом», обеспечивая скачок AI-возможностей.

▍ Прогноз по DeepSeek: продолжение маршрута высокой стоимости, совершенствование возможностей длинного текста, кода, Agent и мультимодальности.

DeepSeek V3.2, выпущенная в январе 26 года, использует архитектуру разреженного внимания (DSA) + смешанные эксперты (MoE), обеспечивая повышение эффективности и снижение затрат при обучении и инференсе; цена токенов для ввода/вывода снижена на 60%/75% соответственно, а также значительно выросли баллы в BenchMark по коду и возможностям множества Agent. В сочетании с направлением эволюции моделей DeepSeek и работой, в которой Лян Вэньфэн участвовал в качестве автора подписи (Engram) на примере статьи по модулю Engram, мы считаем, что такие новые модели, как DeepSeek V4.0 и другие, смогут интегрировать Engram в уже зрелую архитектуру DSA+MoE. За счет многоуровневого хранения ключевой часто используемой информации это позволит добиться экспоненциального снижения объема вычислений в слоях внимания в архитектуре Transformer, тем самым обеспечивая обработку сверхдлинного контекста. Параллельно с повышением эффективности модели будет совершенствоваться код и возможности Agent, а также восполниться дефицит мультимодальности.

▍ Факторы риска:

Развитие ключевых AI-технологий и расширение применений не оправдают ожиданий; снижение затрат на вычислительные мощности не оправдает ожиданий; неправильное использование AI приводит к серьезным социальным последствиям; риск угроз безопасности данных; риск угроз информационной безопасности; усиление отраслевой конкуренции.

▍ Инвестиционная стратегия: мы рекомендуем обратить внимание на следующие три основные линии инвестирования.

1)Производитель моделей: следующая генерация моделей DeepSeek, как ожидается, сможет объединиться с другими отечественными моделями, ускоряя продвижение китайского AI к миру; при этом обучение модели будет продвигаться, снижая себестоимость еще на один шаг, а более дешевые tokens будут в целом увеличивать глобальный объем вызовов API для больших моделей.

2)AI-приложения: равноправие моделей помогает снять беспокойство рынка, вызванное нарративом о противоречиях между моделями и приложениями; способствует внедрению AI Agent во всех отраслях и во многих сегментах, что позитивно для AI-компаний с барьерами.

3)AI-инфраструктура: снижение себестоимости приводит к росту объемов использования, от чего выигрывает AI Infra; отечественная AI Infra движется навстречу отечественным моделям.

(Источник: Первый финансовый журнал)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить