Ф'ючерси
Сотні безстрокових контрактів
TradFi
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
Pre-IPOs
Отримайте повний доступ до глобальних IPO акцій.
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Центр багатства VIP
Преміальні плани зростання капіталу
Управління приватним капіталом
Розподіл преміальних активів
Квантовий фонд
Квантові стратегії найвищого рівня
Стейкінг
Стейкайте криптовалюту, щоб заробляти на продуктах PoS
Розумне кредитне плече
Кредитне плече без ліквідації
Випуск GUSD
Мінтинг GUSD для прибутку RWA
За підсумками зростання на 31.8%, чи вдалося компанії Чіпу успішно запустити продаж API?
Автор: АЧІ
Учора компанія Zhipu опублікувала результати за весь 2025 рік, і це також її перша фінансова звітність після лістингу.
За весь рік дохід склав 724M юанів, що на 131,9% більше в річному вимірі; однак із урахуванням залучення 3.18B юанів витрат на НДДКР скоригований чистий збиток досяг 48M юанів.
Хоча збитків було так багато, реакція ринку була дуже позитивною. Сьогодні акції Zhipu зросли на 31,8%.
Серед цього, дуже важлива причина полягає в тому, що продаж API, здається, вдалося «прогнати» до робочого сценарію.
У 2025 році дохід від продажу API зріс з 0,48 млрд юанів у 2024 році до 190M юанів, тобто на 296% у річному вимірі. Водночас у телефонній нараді керівництво Zhipu прямо зазначило, що поточний ARR для API-послуг становить приблизно 250M доларів США, і очікує, що до кінця року він досягне 1B доларів США.
Ще важливіше: це не є одиничним випадком. В інших компаніях, що працюють із великими мовними моделями, ми також дедалі більше бачимо подібну тенденцію: обсяг викликів Token зростає, а API стає одним із найпряміших шляхів монетизації.
Тож як нам оцінювати цей феномен? Сьогодні поговоримо про нього, спираючись на фінзвіт Zhipu.
/ 01 /
Зростання базової моделі, завдяки продажу API
У цій фінансовій звітності Zhipu найбільш варта уваги зміна — зсув у структурі доходів.
Хмарне розгортання стало найголовнішим джерелом зростання. Під «хмарним розгортанням» по суті мається на увазі API-послуги. У 2025 році дохід з цієї частини зріс з 48M юанів у 2024 році до 1,9 млрд юанів, тобто на 296% у річному вимірі; а частка в доходах також збільшилась з 15,5% до 26,3%.
Зростання API базується на ключовій логіці — зростанні обсягу викликів.
А за цим стоїть безпосередньо вплив OpenClaw. Коли Agent починає автоматично виконувати задачі, один запит часто відповідає багатьом раундам викликів; витрати Token багаторазово зростають, і внаслідок цього підвищується обсяг викликів API.
З цього поступово сформувався галузевий консенсус: коли великі мовні моделі отримують здатність виконувати завдання на довгому горизонті, виклики більше не обмежуються одноразовим введенням-виведенням, а перетворюються на систематичний процес, який можна підтримувати в роботі.
У цій структурі сам Token стає найпрямішою, і водночас найвизначенішою, одиницею нарахування плати.
Інакше кажучи, коли можливості моделі достатньо сильні, сам API починає «згортатися» до найчіткішої комерційної моделі великих мовних моделей.
Ця тенденція перетворюється на спільний вибір виробників великих мовних моделей.
За кордоном це сталося раніше. У Anthropic приблизно 80% доходу надходить від корпоративних сервісів API-викликів; по суті це система стягнення плати, прив’язана до витрат Token.
У Китаї також швидко рухаються в бік цієї структури.
Наразі провідні китайські компанії базових моделей, такі як Zhipu AI, MiniMax і ключові джерела доходу Moonshot AI, поступово зближуються з API-викликами; MaaS (Model as a Service) стає основним шляхом для забезпечення зростання.
Керівництво Zhipu в телефонній нараді прямо зазначило: поточний ARR для API-послуг становить приблизно 250M доларів США, і очікується, що до кінця року він досягне 1B доларів США. У майбутньому компанія більше фокусуватиметься на стандартизованих API-послугах. До 2026 року API-послуги та локалізоване розгортання, за прогнозом, становитимуть приблизно по половині; далі протягом 2–3 років центр ваги ще більше зміститься в бік API.
Подібні зміни відбуваються і в MiniMax.
У 2025 році дохід від відкритої платформи та корпоративних сервісів склав 25,96 млн доларів США, що на 197,8% більше в річному вимірі; частка в доходах зросла з 28,6% до 32,8%.
Станом на лютий 2026 року ARR компанії вже перевищив 150 млн доларів США; порівняно з 79 млн доларів США за фінансовий рік 2025 — це подвоєння зростання. Ключовим драйвером зростання також є підвищення витрат Token, зокрема через розширення сценаріїв для помічників з кодування та агентів (Agent).
Goldman Sachs прогнозує, що частка доходу MiniMax від відкритої платформи (API) у 2026 році становитиме приблизно 40%.
Збирання бізнес-моделі великих мовних моделей у чіткішу форму означає, що й спосіб оцінювання цінності стає прозорішим: від «показників здібностей» до «вимірювання Token».
/ 02 /
Розгалуження шляхів за тим, що ховається в основі: дві ідеї розв’язання задачі
Коли AI переходить у стадію застосувань, виникає конкретніше запитання: яка справжня ключова конкурентна перевага великих мовних моделей, коли їхні можливості поступово сходяться?
Щодо цього питання Zhipu та MiniMax запропонували два різні підходи до розв’язання.
Логіка Zhipu — прагнення до граничного максимуму моделі.
Чжан Пен сформулював концепцію TAC (Token Architecture Capability, здатність токенної архітектури). Її суть можна розкласти на три складові: масштаб викликів, якість викликів і здатність перетворювати це на дохід.
Їхнє ключове судження полягає в тому, що «якість інтелекту визначає право на встановлення ціни».
Судження Zhipu таке: «У міру еволюції Agent Token також буде сегментуватися: token із низькою складністю та стандартизовані токени рухатимуться до низької ціни чи навіть безкоштовності, а лише високоякісні token із високою складністю та високою надійністю матимуть стабільне право на встановлення ціни».
Це вже відобразилося в даних. У першому кварталі ціна API Zhipu зросла на 83%, але попит не скоротився: навпаки, з’явилася ситуація «дефіциту», а обсяг викликів зріс на 400%.
Якщо Zhipu AI говорить про те, що «якість визначає право на встановлення ціни», то MiniMax, по суті, має іншу логіку: конкурентоспроможність моделі походить із «диференціації шляхів» і «ефективності».
MiniMax обрав не зовсім популярний шлях — паралельний розвиток мультимодальних рішень із власною розробкою для чотирьох модальностей: тексту, відео, голосу та музики. У цьому пункті, серед виробників великих мовних моделей на сьогодні, немає нічого надто поширеного.
Ключ цієї стратегії не в тому, що «багато», а в тому, що «широко».
На думку Янь Цзюньцзе, цінність платформної компанії в епоху AI полягає по суті в такому: щільність інтелекту × пропускна здатність Token.
Значення мультимодальності — у тому, щоб, не знижуючи суттєво щільність інтелекту, збільшити пропускну здатність Token. Тому що це змінює не верхню межу можливостей, а поріг використання.
Коли у продукті додаються способи взаємодії на кшталт зображень і голосу, зрозуміти продукт користувачам і користуватися ним стає значно простіше, а поріг операцій знижується. Відповідно розширюється й аудиторія — включно з людьми похилого віку та дітьми, тобто тими групами, які раніше було складно охопити.
Це, по суті, вже траплялося в мобільному інтернеті: від стрічок із текстом і зображеннями до вибухового зростання коротких відео. По суті, всюди це працювало через зниження порогу взаємодії, що приводило до стрибка проникнення.
Тепер подивімося на ефективність. Друга основна лінія MiniMax — це максимально ефективне використання ресурсів.
У 2025 році компанія витратила 253 млн доларів США на розробку, що на 33,8% більше в річному вимірі; це суттєво нижче темпу зростання виручки на 158,9%.
Для порівняння стратегія Zhipu AI більше схожа на підхід «високо підняти — сильно вдарити».
У 2025 році виручка Zhipu становила 724 млн юанів, що відповідає витратам на НДДКР у 3,18 млрд юанів; частка витрат на НДДКР сягнула 439%. У той же період виручка MiniMax — 540 млн юанів, витрати на НДДКР — 3.18B юанів; частка витрат на НДДКР — 323%.
З погляду операційної ефективності: на кожен 1 юань доходу Zhipu припадає приблизно 4,4 юаня збитку; у MiniMax — 3,2 юаня. Щодо ефективності людських ресурсів: у Zhipu — близько 660 тис. юанів на людину, тоді як у MiniMax — 1,26 млн.
Звісно, частина відмінностей тут походить від бізнес-моделей: MiniMax більше покладається на дохід від продуктів, тоді як Zhipu все ще в основному робить ставку на локалізоване розгортання.
Але навіть попри це, розгалуження двох шляхів залишається чітким:
з одного боку — прагнення до «верхньої межі інтелекту» та отримання права на встановлення ціни через нарощування можливостей;
з іншого боку — оптимізація «ефективності та покриття»: за рахунок розширення масштабу використання збільшити пропускну здатність Token.
По суті це один і той самий формульний каркас, але з двома повністю різними способами розв’язання.
/ 03 /
Олігопольна структура — найбільша визначеність для бізнесу базових моделей
Якщо відволіктися від оцінки (valuation), бізнес виробників моделей насправді вже починає вимальовувати доволі чіткий контур.
Бізнес базових моделей — не такий, як традиційне програмне забезпечення.
Традиційне ПЗ: на старті — високі вкладення, а потім поступово відбувається повільне відшкодування. Але базові моделі інакші: їхні витрати зростають «сходинками», тоді як доходи не обов’язково зростають пропорційно — більше того, їх можуть усе сильніше стискати в міру загострення конкуренції.
З цієї точки зору це більше схоже на структуру «вроджено крихку». Але цікаво, що така структура водночас веде до іншого результату:
вона природно рухає ринок до олігополії.
Бо лише дуже небагато компаній здатні безперервно витримувати такий рівень інвестицій. За бізнес-формою це більше схоже на батареї або напівпровідникові фабрики: на старті потрібно колосально інвестувати, але якщо вдалося «занайти місце» і закріпитися, конкурентів стає мало, а «пиріг» досить великий.
Одночасно великі мовні моделі мають ще один більш тонкий момент: це не зовсім ринок «переможець забирає все», радше це ринок із сегментацією.
На самому верхньому рівні моделей навіть 5% переваги в якості, у складних сценаріях, орієнтованих на ефективність (наприклад, coding), можуть перетворюватися на надбавку понад 50% — через мультиплікативний ефект.
Але водночас не всі задачі потребують найсильнішої моделі.
Тож ринок природно сегментується: верхній рівень отримує надбавку, середній рівень працює на масштабах, нижній — закриває довгий хвіст попиту. Навіть між різними рівнями може виникати певний «рух Token»: складні задачі йдуть вгору, а прості — вниз.
Навіть якщо вам не під силу глобально бути SOTA, але ви здатні зробити SOTA в конкретній вузькій сфері — це теж робочий шлях.
І в цій структурі ефективність є дуже ключовою змінною.
Бо в цьому секторі майже немає мережевих ефектів, а вартість переходу користувачів дуже низька. Це означає: якщо існує компанія, яка може створити модель «на 90 балів», але з нижчою ціною, вона здатна швидко наростити обсяги.
У цьому процесі ефективність також стає важливою змінною для комерціалізації.
Оскільки мережевих ефектів немає, вартість переходу низька: доки якась компанія здатна зробити модель «на 90 балів» і водночас запропонувати нижчу ціну, вона зможе швидко розширити обсяги.
Причина дуже проста: у частині сценаріїв не потрібна найсильніша модель. Коли різниця в результативності обмежена, саме ціна стає визначальним фактором.
А за ціною по суті стоять витрати. Це визначається не лише технологіями, а й різницею витрат, зокрема на обчислювальну потужність і електроенергію.
Наприклад, у Китаї: через інженерну оптимізацію, масштабоване розгортання та нижчі витрати на електроенергію можна суттєво знизити витрати на інференс (inference). Завдяки цьому моделі з однаковими можливостями можуть надавати Token-послуги зовні за нижчою ціною.
Зараз частина китайських виробників моделей, виходячи на зовнішні ринки, по суті займається бізнесом «спреду Token».
Безумовно, джерело зростання виручки — це вибуховий попит і олігопольна структура ринку. Але це все не варто надто надихатися, адже через відмінності в конкурентному середовищі Китай і США все ще мають багато різних аспектів у темі продажу API:
Наприклад, екосистема великих мовних моделей у США більше покладається на довгий хвіст потреб розробників; корпоративні клієнти та розробники більше готові платити за можливості, а продуктивність моделей легше напряму перетворюється на надбавку.
А в країні [Китай] виклики більше зосереджені на головних клієнтах, включно з інтернет-платформами та держсектором/корпоративними клієнтами (政企), а також через конкуренцію на стороні постачання. Тому надбавка Token, ймовірно, не триватиме довго.
У певному сенсі можна сказати: у США базові моделі ближчі до поєднання програмного забезпечення та платформи, тоді як у Китаї вони більше схожі на частину інфраструктури.
З цього погляду залишається питання: до якого рівня може досягти комерційна модель китайських компаній із великими мовними моделями — можливо, ще потрібно буде подивитися.