ЦиСин Цзэсянь: DeepSeek следующий поколение новой модели, вероятно, продолжит линию высокоэффективных открытых моделей

robot
Генерация тезисов в процессе

中信证券研究报告指出:自2026年以来,国产大模型厂商聚焦Agent及代码能力升级,竞相发布新模型。即将发布的DeepSeek下一代新模型有望延续高性价比开源模型路线,在能力上实现更强记忆功能与超长上下文处理,精进代码、Agent能力的同时并补齐多模态短板,带来模型原厂、AI应用、AI 基础设施方向的新投资机遇。

1、模型原厂:DeepSeek下一代模型有望与其他国产模型携手,驱动中国AI加速走向世界,同时模型训练推进进一步降本,更廉价的tokens推动全球大模型API调用量整体增加。2、AI应用:模型平权有助于缓解市场对于模型与应用矛盾叙事带来的焦虑,助力千行百业AI Agent落地,利好有壁垒的AI应用公司;3、AI基础设施:降本带来用量增长使AI Infra受益,国产AI Infra与国产模型相向而行。

Ниже приведён полный текст

Компьютерные технологии|DeepSeek:взгляд на следующее поколение моделей

自2026年以来,国产大模型厂商聚焦Agent及代码能力升级,竞相发布新模型。我们认为即将发布的DeepSeek下一代新模型有望延续高性价比开源模型路线,在能力上实现更强记忆功能与超长上下文处理,精进代码、Agent能力的同时并补齐多模态短板,带来模型原厂、AI应用、AI 基础设施方向的新投资机遇。

Код, Agent и нативная мультимодальность:направление модернизации глобальных больших моделей。

В области AI-программирования модернизация обучающих фреймворков, использование полного кодового репозитория и инженерной траектории в качестве обучающих данных, а также введение более глубокой цепочки рассуждений с многошаговым выполнением и самовосстановлением создают условия для того, чтобы AI Coding перешёл от инструментов автодополнения к проектным уровнем автономным интеллектуальным агентам. Harness Engineer, как ожидается, позволит техникам перейти от роли code-инженера к роли менеджера агентами, который помогает AI раскрывать максимум эффективности. В области кластеров из нескольких агентов наглядно проявился потенциал систем multi-agent на продуктовом уровне: OpenClaw в полной мере демонстрирует потенциал multi-agent. Такие отечественные вендоры, как Zhipu, MiniMax, Tencent, Kimi и др., выпустили продукты «в стиле лобстера», высвобождая производительность цифровых сотрудников. В области нативной мультимодальности нативная мультимодальная архитектура уже стала мейнстрим-направлением: гибридное встраивание-кодирование быстро добивается прорыва. При этом отечественным моделям всё ещё предстоит прорыв в ключевых этапах, таких как интерактивное взаимодействие в реальном времени аудио/видео и кросс-модальная непрерывная рассуждательная обработка.

▍ Отечественные большие модели:интенсивные итерации и непрерывные прорывы по возможностям。

1)MiniMax:кодовые возможности进一步升级,тестовый результат M2.7 SWE-Pro составляет 56.22%, превысив Gemini 3.1 Pro;в сценарии тестирования VIBE-Pro по сквозной поставке полного проекта端到端得分55.6%,сравнимо с Claude Opus 4.6;понимание логики работы программных систем дополнительно усилено. Кроме того, модели серии M2 участвуют в обучении M2.7 в таких сценариях, как RL, реализуя самоитерацию модели。

2)智谱:GLM-5 вводит DSA и разрабатывает собственную архитектуру «Slime». Она позволяет с минимальным вмешательством человека автономно выполнять системно-инженерные задачи, такие как агентное долгосрочное планирование и выполнение, реконфигурацию бэкенда и глубокую отладку. При этом возможности в вызове инструментов и выполнении многошаговых задач (MCP-Atlas 67.8%), а также в сетевом поиске и понимании информации (Browse Comp 89.7%) приближаются или даже превосходят уровень ведущих зарубежных моделей。

3)Kimi:Kimi 2.5 вводит визуальные возможности для автоматического разбиения логики взаимодействия, воспроизведения кода. Вновь представленный режим кластеров агентов в тестовых наборах интеллектуальных агентских приложений, таких как HLE-Full, BrowseComp, DeepSearchQA, получил баллы для сопоставления с GPT-5.2, Claude 4.5 Opus и Gemini 3 Pro. Moonshoot использует стратегию снижения цены: API-цена по сравнению с K2 Turbo снижена более чем на 30%。

4)小米:Xiaomi MiMo-V2-Pro в тестовых наборах оценки возможностей моделей и вызова агентами, таких как ClawEval и t2-bench, приближается или даже опережает некоторые зарубежные топ-модели. Его ранние внутренние тестовые версии с анонимным кодовым названием Hunter Alpha были запущены на OpenRouter, и в период запуска в течение нескольких дней поднимались на вершину ежедневного рейтинга по объёму вызовов. Мы позитивно оцениваем то, что базовая платформа больших моделей сможет наделить экосистему Xiaomi «человек-автомобиль-дом» возможностями для скачка в уровне AI。

▍ Прогноз по DeepSeek:продолжение линии высокой ценности, совершенствование возможностей по длинным текстам, коду, Agent и мультимодальности。

DeepSeek в январе 26 года выпустила DeepSeek V3.2 с архитектурой разрежённого внимания (DSA) + mixture of experts (MoE), реализующей повышение эффективности и снижение затрат при обучении и выводе. Ценообразование на входные/выходные token снижено на 60%/75% соответственно. При этом баллы по бенчмаркам кодовых и multi-agent возможностей существенно выросли. В сочетании с направлением эволюции моделей DeepSeek и статьёй по модулю Engram, в соавторстве с Liang Wenfeng, мы считаем, что новые поколения моделей, такие как DeepSeek V4.0, могут интегрировать Engram в уже зрелую архитектуру DSA+MoE: за счёт многоуровневого хранения ключевой информации, часто используемой, можно добиться экспоненциального снижения вычислительной нагрузки на слой внимания в архитектуре Transformer, тем самым обеспечив обработку сверхдлинного контекста. Это позволит повысить эффективность модели, одновременно совершенствуя возможности по коду и Agent, и закрыть краткие места в мультимодальности.

▍ Факторы риска:

Развитие ключевых AI-технологий и расширение приложений не соответствуют ожиданиям, снижение стоимости вычислений не соответствует ожиданиям, неправильное использование AI приводит к серьёзным социальным последствиям, риски безопасности данных, риски информационной безопасности, усиление отраслевой конкуренции.

▍ Инвестстратегия:мы рекомендуем обратить внимание на следующие три основные инвестиционные линии。

1)Модельный вендор:следующее поколение моделей DeepSeek, как ожидается, сможет вместе с другими отечественными моделями ускорить продвижение китайского AI в мир, а также позволит за счёт более дешёвых tokens ещё сильнее снизить затраты на обучение; более дешёвые tokens ведут к общему росту количества вызовов API глобальных больших моделей.

2)AI-приложения:модельное равноправие помогает снять тревогу рынка, связанную с нарративом о противоречии между моделями и приложениями, способствует внедрению AI Agent в тысячи отраслей, благоприятно для компаний с барьерами;

3)AI-инфраструктура:снижение затрат приводит к росту объёмов использования, от чего выигрывает AI Infra; отечественная AI Infra и отечественные модели движутся навстречу друг другу。

(Источник: 第一财经)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.22KДержатели:1
    0.00%
  • РК:$2.23KДержатели:1
    0.00%
  • РК:$2.23KДержатели:0
    0.00%
  • РК:$2.24KДержатели:2
    0.24%
  • РК:$2.23KДержатели:2
    0.00%
  • Закрепить