ЦиСин Цзэсянь: DeepSeek следующий поколение новой модели, вероятно, продолжит линию высокоэффективных открытых моделей

CryptocurrencySniper · 2026-04-03T00:56:43+00:00

Отчет CITIC Securities отмечает, что отечественные производители крупных моделей сосредоточатся на обновлении возможностей агента и кода. Новая модель DeepSeek, которая скоро будет выпущена, обещает улучшить функции памяти и обработки контекста, а также открывает новые инвестиционные возможности для производителей моделей, AI-приложений и инфраструктуры. Снижение стоимости моделей увеличит глобальный объем API-запросов, способствуя внедрению AI-приложений и развитию инфраструктуры.

CryptocurrencySniper

2026-04-03 00:56:43

Генерация тезисов в процессе

中信证券研究报告指出：自2026年以来，国产大模型厂商聚焦Agent及代码能力升级，竞相发布新模型。即将发布的DeepSeek下一代新模型有望延续高性价比开源模型路线，在能力上实现更强记忆功能与超长上下文处理，精进代码、Agent能力的同时并补齐多模态短板，带来模型原厂、AI应用、AI 基础设施方向的新投资机遇。

1、模型原厂：DeepSeek下一代模型有望与其他国产模型携手，驱动中国AI加速走向世界，同时模型训练推进进一步降本，更廉价的tokens推动全球大模型API调用量整体增加。2、AI应用：模型平权有助于缓解市场对于模型与应用矛盾叙事带来的焦虑，助力千行百业AI Agent落地，利好有壁垒的AI应用公司；3、AI基础设施：降本带来用量增长使AI Infra受益，国产AI Infra与国产模型相向而行。

Ниже приведён полный текст

Компьютерные технологии｜DeepSeek：взгляд на следующее поколение моделей

自2026年以来，国产大模型厂商聚焦Agent及代码能力升级，竞相发布新模型。我们认为即将发布的DeepSeek下一代新模型有望延续高性价比开源模型路线，在能力上实现更强记忆功能与超长上下文处理，精进代码、Agent能力的同时并补齐多模态短板，带来模型原厂、AI应用、AI 基础设施方向的新投资机遇。

▍ Код, Agent и нативная мультимодальность：направление модернизации глобальных больших моделей。

В области AI-программирования модернизация обучающих фреймворков, использование полного кодового репозитория и инженерной траектории в качестве обучающих данных, а также введение более глубокой цепочки рассуждений с многошаговым выполнением и самовосстановлением создают условия для того, чтобы AI Coding перешёл от инструментов автодополнения к проектным уровнем автономным интеллектуальным агентам. Harness Engineer, как ожидается, позволит техникам перейти от роли code-инженера к роли менеджера агентами, который помогает AI раскрывать максимум эффективности. В области кластеров из нескольких агентов наглядно проявился потенциал систем multi-agent на продуктовом уровне: OpenClaw в полной мере демонстрирует потенциал multi-agent. Такие отечественные вендоры, как Zhipu, MiniMax, Tencent, Kimi и др., выпустили продукты «в стиле лобстера», высвобождая производительность цифровых сотрудников. В области нативной мультимодальности нативная мультимодальная архитектура уже стала мейнстрим-направлением: гибридное встраивание-кодирование быстро добивается прорыва. При этом отечественным моделям всё ещё предстоит прорыв в ключевых этапах, таких как интерактивное взаимодействие в реальном времени аудио/видео и кросс-модальная непрерывная рассуждательная обработка.

▍ Отечественные большие модели：интенсивные итерации и непрерывные прорывы по возможностям。

1）MiniMax：кодовые возможности进一步升级，тестовый результат M2.7 SWE-Pro составляет 56.22%, превысив Gemini 3.1 Pro；в сценарии тестирования VIBE-Pro по сквозной поставке полного проекта端到端得分55.6%，сравнимо с Claude Opus 4.6；понимание логики работы программных систем дополнительно усилено. Кроме того, модели серии M2 участвуют в обучении M2.7 в таких сценариях, как RL, реализуя самоитерацию модели。

2）智谱：GLM-5 вводит DSA и разрабатывает собственную архитектуру «Slime». Она позволяет с минимальным вмешательством человека автономно выполнять системно-инженерные задачи, такие как агентное долгосрочное планирование и выполнение, реконфигурацию бэкенда и глубокую отладку. При этом возможности в вызове инструментов и выполнении многошаговых задач (MCP-Atlas 67.8%), а также в сетевом поиске и понимании информации (Browse Comp 89.7%) приближаются или даже превосходят уровень ведущих зарубежных моделей。

3）Kimi：Kimi 2.5 вводит визуальные возможности для автоматического разбиения логики взаимодействия, воспроизведения кода. Вновь представленный режим кластеров агентов в тестовых наборах интеллектуальных агентских приложений, таких как HLE-Full, BrowseComp, DeepSearchQA, получил баллы для сопоставления с GPT-5.2, Claude 4.5 Opus и Gemini 3 Pro. Moonshoot использует стратегию снижения цены: API-цена по сравнению с K2 Turbo снижена более чем на 30%。

4）小米：Xiaomi MiMo-V2-Pro в тестовых наборах оценки возможностей моделей и вызова агентами, таких как ClawEval и t2-bench, приближается или даже опережает некоторые зарубежные топ-модели. Его ранние внутренние тестовые версии с анонимным кодовым названием Hunter Alpha были запущены на OpenRouter, и в период запуска в течение нескольких дней поднимались на вершину ежедневного рейтинга по объёму вызовов. Мы позитивно оцениваем то, что базовая платформа больших моделей сможет наделить экосистему Xiaomi «человек-автомобиль-дом» возможностями для скачка в уровне AI。

▍ Прогноз по DeepSeek：продолжение линии высокой ценности, совершенствование возможностей по длинным текстам, коду, Agent и мультимодальности。

DeepSeek в январе 26 года выпустила DeepSeek V3.2 с архитектурой разрежённого внимания (DSA) + mixture of experts (MoE), реализующей повышение эффективности и снижение затрат при обучении и выводе. Ценообразование на входные/выходные token снижено на 60%/75% соответственно. При этом баллы по бенчмаркам кодовых и multi-agent возможностей существенно выросли. В сочетании с направлением эволюции моделей DeepSeek и статьёй по модулю Engram, в соавторстве с Liang Wenfeng, мы считаем, что новые поколения моделей, такие как DeepSeek V4.0, могут интегрировать Engram в уже зрелую архитектуру DSA+MoE: за счёт многоуровневого хранения ключевой информации, часто используемой, можно добиться экспоненциального снижения вычислительной нагрузки на слой внимания в архитектуре Transformer, тем самым обеспечив обработку сверхдлинного контекста. Это позволит повысить эффективность модели, одновременно совершенствуя возможности по коду и Agent, и закрыть краткие места в мультимодальности.

▍ Факторы риска：

Развитие ключевых AI-технологий и расширение приложений не соответствуют ожиданиям, снижение стоимости вычислений не соответствует ожиданиям, неправильное использование AI приводит к серьёзным социальным последствиям, риски безопасности данных, риски информационной безопасности, усиление отраслевой конкуренции.

▍ Инвестстратегия：мы рекомендуем обратить внимание на следующие три основные инвестиционные линии。

1）Модельный вендор：следующее поколение моделей DeepSeek, как ожидается, сможет вместе с другими отечественными моделями ускорить продвижение китайского AI в мир, а также позволит за счёт более дешёвых tokens ещё сильнее снизить затраты на обучение; более дешёвые tokens ведут к общему росту количества вызовов API глобальных больших моделей.

2）AI-приложения：модельное равноправие помогает снять тревогу рынка, связанную с нарративом о противоречии между моделями и приложениями, способствует внедрению AI Agent в тысячи отраслей, благоприятно для компаний с барьерами；

3）AI-инфраструктура：снижение затрат приводит к росту объёмов использования, от чего выигрывает AI Infra; отечественная AI Infra и отечественные модели движутся навстречу друг другу。

（Источник: 第一财经）

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .