China Securities: DeepSeek наступна генерація нової моделі має потенціал продовжити шлях відкритих моделей з високою співвідношенням ціна-якість

CryptocurrencySniper · 2026-04-04T05:22:08+00:00

Звіт дослідницької компанії CITIC Securities зазначає, що виробники великих внутрішніх моделей зосередяться на оновленні можливостей агентів та коду, а нова модель DeepSeek, яка незабаром буде випущена, має потенціал покращити функцію пам’яті та обробку контексту. Це також відкриває нові інвестиційні можливості для виробників моделей, AI-застосунків та інфраструктури. Зниження вартості моделей сприятиме збільшенню глобального обсягу викликів API, сприяючи впровадженню AI-застосунків та розвитку інфраструктури.

CryptocurrencySniper

2026-04-04 05:22:08

Генерація анотацій у процесі

CITIC Securities дослідницький звіт зазначає, що починаючи з 2026 року вітчизняні виробники великих моделей зосередилися на оновленні можливостей Agent і коду, змагаючись у випуску нових моделей. Ми вважаємо, що майбутня наступна генерація моделей DeepSeek, імовірно, продовжить маршрут високоцінних відкритих моделей, реалізує сильніші функції пам’яті та обробку наддовгого контексту, удосконалюючи можливості коду та Agent, одночасно доповнивши слабкі місця в мультимодальності, що відкриває нові інвестиційні можливості в напрямах виробників базових моделей, AI-застосунків і AI-інфраструктури.

1、виробники базових моделей: наступні моделі DeepSeek, імовірно, зможуть співпрацювати з іншими вітчизняними моделями, прискорюючи рух китайського AI до світу, а також тренування моделей просуватиметься вперед у бік подальшого зниження витрат; дешевші tokens сприятимуть загальному збільшенню обсягів викликів API глобальними великими моделями. 2、AI-застосунки: рівноправність моделей допомагає зменшити тривогу ринку, спричинену наративом про суперечності між моделями та застосунками, сприяє впровадженню AI Agent у тисячі сфер і галузей, вигідно для AI-застосунків із бар’єрами; 3、AI-інфраструктура: зниження витрат веде до зростання використання, від чого виграє AI Infra; вітчизняна AI-інфраструктура та вітчизняні моделі рухаються назустріч одна одній.

Увесь текст нижче

Комп’ютери｜DeepSeek: перспективи наступної генерації моделей

Починаючи з 2026 року вітчизняні виробники великих моделей зосередилися на оновленні можливостей Agent і коду, змагаючись у випуску нових моделей. Ми вважаємо, що майбутня наступна генерація моделей DeepSeek, імовірно, продовжить маршрут високоцінних відкритих моделей, реалізує сильніші функції пам’яті та обробку наддовгого контексту, удосконалюючи можливості коду та Agent, одночасно доповнивши слабкі місця в мультимодальності, що відкриває нові інвестиційні можливості в напрямах виробників базових моделей, AI-застосунків і AI-інфраструктури.

▍ Код, Agent, нативна мультимодальність: напрями оновлення глобальних великих моделей.

У сфері AI програмування оновлення тренувальних фреймворків, використання повних кодових репозиторіїв і інженерних траєкторій як тренувальних даних, а також упровадження більш глибоких ланцюжків міркувань із багатокроковим виконанням і самовідновленням зумовили те, що AI Coding перейшов від інструментів доповнення коду до проєктних рівнів автономних інтелектуальних агентів; Harness Engineer, ймовірно, допоможе технічним спеціалістам перейти від ролі інженера з коду до менеджера Agent, який максимізує ефективність, з якою AI проявляє себе. У сфері кластерів із багатьма Agent на рівні «продуктів-ефектів» OpenClaw демонструє потенціал систем із багатьма Agent; компанії в Китаї, зокрема Zhipu, MiniMax, Tencent, Kimi тощо, також випустили «квазі-лобстерові» продукти, вивільнивши продуктивність цифрових працівників. У сфері нативної мультимодальності нативна мультимодальна архітектура вже стала магістральним напрямом; гібридне вбудовування та кодування швидко прориваються, однак вітчизняні моделі ще потребують прориву в ключових етапах, як-от інтерактивність у реальному часі для аудіо/відео та крос-модальне безперервне виведення.

▍ Вітчизняні великі моделі: часті ітерації та безперервні прориви в можливостях.

1）MiniMax: можливості в галузі коду ще більше підвищилися; у тесті M2.7 SWE-Pro набрано 56.22%, що перевищує Gemini 3.1 Pro; у тестовому сценарії VIBE-Pro з енд-ту-енд повної здачі проєкту на практиці набрано 55.6%, що дорівнює Claude Opus 4.6; розуміння логіки роботи програмних систем було додатково посилено. Крім того, моделі серії M2 брали участь у сценаріях на кшталт RL під час тренувального процесу M2.7, реалізуючи самостійні ітерації моделі.

2）Zhipu: GLM-5 упроваджує DSA та власну архітектуру «Slime»; вона дає змогу з мінімальним втручанням людини автономно завершувати системні інженерні задачі, як-от agentic довготривале планування та виконання, реконструкція бекенда та глибоке налагодження; при цьому можливості у викликах інструментів і виконанні багатоетапних задач (MCP-Atlas 67.8%), а також мережевому пошуку та розумінні інформації (Browse Comp 89.7%) наближені або навіть перевищують рівень провідних заморських моделей.

3）Kimi: Kimi 2.5 упровадив візуальні можливості для автоматичного розкладання логіки взаємодії, відтворення коду; також було представлено новий режим кластерів Agent. У тестовій добірці інтелектуальних застосунків, зокрема HLE-Full, BrowseComp, DeepSearchQA тощо, отримано бали для зіставлення з GPT-5.2, Claude 4.5 Opus, Gemini 3 Pro; Moonshoot використовує стратегію зниження цін, а ціна API порівняно з K2 Turbo знижена більш ніж на 30%.

4）Xiaomi: Xiaomi MiMo-V2-Pro у тестових добірках, що оцінюють можливості викликів моделей і Agent, як-от ClawEval, t2-bench, наближається або навіть випереджає частину провідних заморських моделей. У ранніх внутрішніх тестових версіях із анонімним кодовим позначенням Hunter Alpha запущено OpenRouter; під час запуску протягом кількох днів виходив на вершину щоденного рейтингу за обсягами викликів. Ми позитивно оцінюємо, що базові можливості великих моделей дадуть змогу Xiaomi охопити весь екосистемний ланцюжок «людина-автомобіль-домівка», забезпечуючи стрибок у можливостях AI.

▍ Перспективи DeepSeek: продовження маршруту високої цінності, удосконалення довгих текстів, коду, Agent та мультимодальних можливостей.

DeepSeek у січні 2026 року оприлюднив DeepSeek V3.2, який використовує архітектуру sparse attention (DSA) + mixture of experts (MoE), реалізовуючи підвищення ефективності тренування та виведення зі зниженням витрат; ціни за вхідні/вихідні token відповідно знижені на 60%/75%. Водночас у бенчмарках для коду та можливостей багатьох Agent значно зросли результати. З огляду на напрям еволюції моделей DeepSeek та статтю про модуль Engram, у якій брав участь Liang Wenfeng, ми вважаємо, що такі нові генераційні моделі, як DeepSeek V4.0, імовірно, зможуть інтегрувати Engram в уже зрілу архітектуру DSA+MoE: за рахунок ієрархічного зберігання ключової часто використовуваної інформації відбудеться експоненційне зниження обчислювального навантаження в шарах attention у трансформаторній архітектурі; таким чином можна досягти обробки наддовгого контексту, одночасно підвищуючи ефективність моделі та удосконалюючи можливості коду й Agent, а також закриваючи недоліки в мультимодальності.

▍ Фактори ризику:

Розвиток AI-ключових технологій та розширення застосувань не виправдає очікувань, зниження витрат на обчислювальні ресурси не виправдає очікувань, неналежне використання AI спричинить серйозні суспільні наслідки, ризики безпеки даних, ризики інформаційної безпеки, посилення конкуренції в галузі.

▍ Інвестиційна стратегія: ми рекомендуємо приділяти увагу таким трьом основним інвестиційним напрямам.

1）Виробники базових моделей: наступні моделі DeepSeek, імовірно, зможуть співпрацювати з іншими вітчизняними моделями, прискорюючи рух китайського AI до світу, а також тренування моделей просуватиметься вперед у бік подальшого зниження витрат; дешевші tokens сприятимуть загальному збільшенню обсягів викликів API глобальними великими моделями.

2）AI-застосунки: рівноправність моделей допомагає зменшити тривогу ринку, спричинену наративом про суперечності між моделями та застосунками, сприяє впровадженню AI Agent у тисячі сфер і галузей, вигідно для AI-застосунків із бар’єрами;

3）AI-інфраструктура: зниження витрат веде до зростання використання, від чого виграє AI Infra; вітчизняна AI-інфраструктура та вітчизняні моделі рухаються назустріч одна одній.

(Джерело: Перша фінансова інформація)

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.