China Securities: DeepSeek наступна генерація нової моделі має потенціал продовжити шлях відкритих моделей з високою співвідношенням ціна-якість

robot
Генерація анотацій у процесі

Служба аналітики Citic Securities (中信证券) зазначає, що починаючи з 2026 року вітчизняні постачальники великих мовних моделей зосереджуються на апгрейді можливостей Agent та коду, і змагаються за випуск нових моделей. Очікується, що наступна генерація нової моделі DeepSeek, яку незабаром буде представлено, продовжить маршрут високої рентабельності відкритих моделей; за можливостями вона забезпечить сильніші функції пам’яті та обробку наддовгого контексту, удосконалюючи можливості коду та Agent, а також заповнюючи прогалину в мультимодальності, що принесе нові інвестиційні можливості в напрямах модельних оригінальних виробників, AI-застосунків та AI базової інфраструктури.

1、Модельні оригінальні виробники: наступна генерація моделей DeepSeek, як очікується, зможе співпрацювати з іншими вітчизняними моделями, прискорюючи рух китайського AI до світу; водночас навчання моделей просувається ще на один крок у бік зниження витрат, а дешевші tokens сприятимуть загальному збільшенню кількості викликів API глобальних великих моделей.2、AI-застосунки: рівноправність моделей допомагає зменшити тривогу ринку, що виникає через наратив про суперечність між моделями та застосунками; це сприяє впровадженню AI Agent у тисячі галузей і є позитивним для AI-застосункових компаній із бар’єрами входу;3、AI базова інфраструктура: зниження витрат веде до зростання обсягів використання, тож AI Infra отримує вигоду; вітчизняна AI базова інфраструктура та вітчизняні моделі рухаються назустріч одна одній。

Увесь текст такий:

Комп’ютерні технології|DeepSeek: перспективи наступної генерації моделей

Починаючи з 2026 року вітчизняні постачальники великих мовних моделей зосереджуються на апгрейді можливостей Agent та коду, і змагаються за випуск нових моделей. Ми вважаємо, що наступна генерація нової моделі DeepSeek, яку незабаром буде представлено, продовжить маршрут високої рентабельності відкритих моделей; за можливостями вона забезпечить сильніші функції пам’яті та обробку наддовгого контексту, удосконалюючи можливості коду та Agent, а також заповнюючи прогалину в мультимодальності, що принесе нові інвестиційні можливості в напрямах модельних оригінальних виробників, AI-застосунків та AI базової інфраструктури.

Код, Agent, нативна мультимодальність: напрями апгрейду глобальних великих моделей.

У сфері AI програмування: апгрейд навчальних фреймворків, використання повних кодових репозиторіїв і інженерних треків як тренувальних даних, а також запровадження глибшого ланцюга міркувань із багатокроковим виконанням і самовиправленням сприяли тому, що AI Coding перейшов від інструментів доповнення коду до проєктного рівня автономних інтелектуальних агентів; Harness Engineer може допомогти технічним фахівцям перейти від ролі кодових інженерів до ролі менеджерів агентів, які максимально розкривають потенціал AI. У сфері кластерів із багатьма агентами продукт OpenClaw наочно демонструє потенціал систем із багатьма агентами; компанії Зіҳуа (智谱), MiniMax, Tencent, Kimi та інші вітчизняні постачальники також випустили продукти «на кшталт лобстера», вивільняючи продуктивність цифрових працівників. У нативній мультимодальності нативна мультимодальна архітектура вже стала основним напрямом; гібридне вбудовування та кодування швидко прориваються, але вітчизняні моделі все ще мають потребу в прориві в ключових етапах, зокрема в реальному часі в аудіо-/відеоінтеракціях та в кросмодальних безперервних міркуваннях.

▍ Вітчизняні великі мовні моделі: щільні ітерації та безперервні прориви в можливостях.

1)MiniMax: можливості роботи з кодом додатково покращено; у тесті M2.7 SWE-Pro результат 56,22%, що вище за Gemini 3.1 Pro; у сценарії VIBE-Pro для тесту реалізації наскрізної повної здачі проєкту (end-to-end) результат 55,6%, на рівні Claude Opus 4.6; розуміння логіки роботи програмних систем ще більше посилилося. Крім того, моделі серії M2 беруть участь у сценаріях на кшталт RL у процесі тренування M2.7, реалізуючи самостійну ітерацію моделі.

2)智谱 (Zhipu): GLM-5 запроваджує DSA та власну архітектуру «Slime»; вона здатна автономно виконувати агентні далекострокові планування й виконання, реконструкцію бекенда, глибоке налагодження тощо системних інженерних задач із надзвичайно малим рівнем ручного втручання. Її можливості в викликах інструментів і виконанні багатокрокових задач (MCP-Atlas 67,8%), у мережевому пошуку та розумінні інформації (Browse Comp 89,7%) наближаються або навіть перевищують рівень провідних зарубіжних моделей.

3)Kimi: Kimi 2.5 запровадила візуальні можливості для автоматичного розкладання логіки взаємодії, відтворення коду; було представлено новий режим кластерів Agent. У сукупності тестів застосунків агентів, зокрема HLE-Full, BrowseComp, DeepSearchQA, отримані бали відповідають GPT-5.2, Claude 4.5 Opus, Gemini 3 Pro. Moonshoot застосовує стратегію зниження ціни, а API-ціна порівняно з K2 Turbo знижена більш ніж на 30%.

4)Xiaomi: Xiaomi MiMo-V2-Pro у тестових наборах, які вимірюють можливості виклику агентів моделі, таких як ClawEval, t2-bench, наближається або навіть випереджає частину зарубіжних провідних моделей. Її ранні внутрішні тестові версії під анонімним кодовим позначенням Hunter Alpha були запущені на OpenRouter; у період запуску протягом кількох днів підряд піднімалася на вершину щоденного рейтингу за обсягом викликів. Ми позитивно оцінюємо, що базова платформа великої моделі надасть Xiaomi можливість у всій екосистемі «людина—автомобіль—дім», забезпечивши стрибок у підвищенні AI-здатностей.

▍ Прогноз щодо DeepSeek: продовження маршруту високої рентабельності, удосконалення можливостей довгих текстів, коду, Agent та мультимодальності.

DeepSeek у січні 26-го випустила DeepSeek V3.2, яка використовує архітектуру зі sparse attention (DSA) + mixture of experts (MoE); це забезпечує підвищення ефективності тренування та інференсу зі зниженням витрат. Ціноутворення на вхідні/вихідні tokens знижено на 60%/75% відповідно; водночас у бенчмарках для коду та можливостей багатьох Agent істотно зросли бали. Спираючись на напрям еволюції моделей DeepSeek та наукову роботу про модуль Engram, у підписанні якої брав участь Лян Веньфенг, ми вважаємо, що нові моделі наступного покоління, такі як DeepSeek V4.0, зможуть інтегрувати Engram у вже зрілу архітектуру DSA+MoE: шляхом багаторівневого зберігання ключової та часто використовуваної інформації можна досягти експоненційного зниження обчислювального навантаження на рівні attention в архітектурі Transformer. Це дозволить обробляти наддовгий контекст; одночасно, підвищуючи ефективність моделі, удосконалювати можливості коду та Agent і компенсувати слабкість у мультимодальності.

▍ Фактори ризику:

Розвиток ключових AI-технологій і розширення застосувань не виправдовують очікувань; зниження витрат на обчислювальні ресурси також не виправдовує очікувань; неправильне використання AI спричиняє серйозні соціальні наслідки; ризики безпеки даних; ризики інформаційної безпеки; загострення галузевої конкуренції.

▍ Інвестиційна стратегія: ми рекомендуємо звернути увагу на такі три інвестиційні основні напрями.

1)Модельні оригінальні виробники: наступна генерація моделей DeepSeek, як очікується, зможе співпрацювати з іншими вітчизняними моделями, прискорюючи рух китайського AI до світу; водночас навчання моделей просувається ще на один крок у бік зниження витрат, а дешевші tokens сприятимуть загальному збільшенню кількості викликів API глобальних великих моделей.

2)AI-застосунки: рівноправність моделей допомагає зменшити тривогу ринку, що виникає через наратив про суперечність між моделями та застосунками; це сприяє впровадженню AI Agent у тисячі галузей і є позитивним для AI-застосункових компаній із бар’єрами входу;

3)AI базова інфраструктура: зниження витрат веде до зростання обсягів використання, тож AI Infra отримує вигоду; вітчизняна AI базова інфраструктура та вітчизняні моделі рухаються назустріч одна одній.

(Джерело публікації: Перша фінансова інформація)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити