Перший фінансовий звіт після IPO компанії Zhipu, найбільшої в країні компанії з великими моделями, дохід від MaaS ARR склав 1,7 мільярда.

Питай AI · Як модель MaaS від Zhipu може забезпечити суттєве зростання маржинальності прибутку?

31 березня техногігант-єдиноріг у сфері великих AI-моделей Zhipu представив перший річний звіт за підсумками після виходу на біржу. Остання фінансова звітність показує, що впродовж року, який завершився 31 грудня 2025 року, Zhipu досягла річного доходу понад 724 млн юанів, що на 131,9% більше порівняно з попереднім роком. Для порівняння: у 2022–2024 роках річний дохід компанії становив відповідно 57 млн юанів, 125 млн юанів і 312 млн юанів, демонструючи тенденцію до безперервного прискорення зростання.

За обсягом доходів Zhipu вже стала найбільшою в Китаї компанією з великих моделей за розміром виручки. Для орієнтиру: інша компанія з великих моделей, яка котирується на біржі Гонконгу, MiniMax, у 2025 році мала сумарний дохід близько 79,04 млн доларів США. З погляду бізнес-моделі шляхи двох компаній також розійшлися. MiniMax більше зосереджується на AI-нативних продуктах, тоді як Zhipu переважно використовує модель і сервіси (MaaS): через API-запити надає інтелектуальні сервіси бізнес-клієнтам і розробникам.

Розбираючи цей фінансовий звіт Zhipu, ключовим показником, на який варто звернути увагу, є те, що ARR (річний регулярний дохід) її MaaS API-платформи становить приблизно 1,7 млрд юанів, що в рік до року зросло у 60 разів. ARR зазвичай використовують для оцінки здатності компанії генерувати безперервний дохід; це може відображати стан здоров’я бізнесу. У MaaS-моделі цей індикатор ще точніше показує, чи клієнти постійно викликають моделі й стабільно витрачають Token, а не покладаються на зростання доходу за рахунок разових проєктів.

Раніше ринок сприймав Zhipu більше як компанію великих моделей із проєктно-орієнтованим підходом. Але коли структура доходів Zhipu змінилася на MaaS-модель, де основою є виклики через API, логіка зростання доходів також почала змінюватися: уже не потрібно покладатися на один-єдиний проєкт, натомість потрібно спиратися на сталі моделі поведінки використання.

Певною мірою шлях Zhipu не може не нагадати глобально провідну AI-компанію Anthropic. З одного боку, вона безперервно підсилює можливості базових моделей і підвищує їхній верхній поріг. З іншого боку, вона використовує як основну форму продукту Token: зростання стимулюється за рахунок глибокого використання з боку розробницької екосистеми та корпоративних клієнтів. У рамках цієї логіки Zhipu поступово стає прикладом компанії з великих моделей на китайському ринку, яка все більше наближається до траєкторії розвитку Anthropic.

Відкриття “MaaS”: зростання доходу без зростання без прибутку**: підвищення цін без втрати обсягу, повернення до суті бізнесу**

На ринку впродовж тривалого часу існує типове запитання щодо MaaS: чи не легко потрапити в пастку “зростання доходу без зростання прибутку”. Причина в тому, що дохід MaaS безпосередньо прив’язаний до споживання Token, а за Token стоять безперервні обчислювальні витрати на потужності. Коли дохід і витрати поєднані в одному ланцюжку, то з розширенням масштабу простір для прибутку часто стискається під тиском, що постійно зростає. Лише трохи не обережно — і можна опинитися в незручній ситуації “чим більше робиш, тим тоншим стає заробіток”.

Втім, остання фінансова звітність Zhipu передає доволі позитивні сигнали. Її MaaS API-платформа суттєво підвищила валову маржу: з 3,3% у 2024 році до 18,9% у 2025 році, тобто загальна здатність генерувати прибуток помітно поліпшилася. У поєднанні з раніше розкритими даними в проспекті під час IPO, у періоді попередньої дії (2022–2024) загальна валова маржа Zhipu залишалася відносно стабільною, довго тримаючись на рівні понад 50%.

Окрім екстремальної оптимізації ефективності виведення/інференсу моделей та доведення Token-витрат до мінімуму, ще одним ключовим чинником підвищення валової маржі є безперервне зростання частки високовартісних клієнтів з “голови” (top segments).

Згідно з розкриттям у звіті, понад 4 млн корпоративних користувачів і розробників у реальних виробничих середовищах безперервно викликають модельні можливості Zhipu, охоплюючи 218 країн і регіонів у всьому світі. Серед топ-10 інтернет-компаній Китаю 9 компаній використовують моделі GLM Zhipu. Наприклад, для моделі GLM-5: після її випуску вже впродовж 24 годин вона отримала офіційне підключення кількох продуктів провідних платформ, зокрема TRAE/Coze від ByteDance, Qoder від Alibaba, CodeBuddy від Tencent, CatPaw від Meituan тощо.

З іншого боку, ці топ-клієнти більш чутливі до якості роботи моделей, але відносно більш толерантні до цін. Важливий сигнал у тому, що Zhipu цього лютого оголосила структурні зміни в системі цін для пакета GLMCodingPlan: загальне підвищення цін починається від 30%, щоб забезпечити стабільність і якість сервісу за високого навантаження. Хоча в першому кварталі ціни на API зросли на 83%, обсяг звернень (кількість викликів) не лише не знизився, а навпаки зріс. Це показує, що клієнти насправді готові платити за ефект/результат, а не поступатися ціною.

Для Zhipu це також формує позитивний зворотний зв’язок, який виникає завдяки підвищенню цін. Вища ціна певною мірою відсікає тих клієнтів, хто більше цінує ефективність; такі клієнти зазвичай мають вищі показники ретеншну та глибину використання, що, своєю чергою, ще більше зміцнює якість бізнесу та здатність до тривалого зростання.

На підсесії в межах щорічної конференції 2026 Zhongguancun Forum, що відбулася 27 березня, CEO Zhipu Чжан Пэн під час обговорення підвищення цін на моделі зазначив: коли модель обробляє складні завдання, ланцюг міркувань і мислення постійно подовжується; кількість Token, необхідних для виконання одного завдання, може сягати у 10 разів або навіть у 100 разів більше, ніж для простих запитань і відповідей. Тому відповідне коригування цін, по суті, є природним результатом зміни витрат. Підвищення можливостей моделей також підвищує витрати на сервіси; сподіваються поступово повернути їх у нормальний діапазон комерційної цінності.

“Довгострокова залежність від конкуренції за низькими цінами насправді не сприяє розвитку всієї галузі, і це є одним з наших важливих міркувань.” — додав Чжан Пэн. “Ми хочемо, щоб у такий спосіб на шляху комерціалізації сформувався більш здоровий замкнений цикл: безперервно оптимізувати можливості моделей і більш довго та стабільно надавати всім кращі моделі та відповідні Token-сервіси.”

Зрештою, ключове судження Zhipu можна підсумувати так: інтелектуальний верхній поріг визначає силу ціноутворення, а масштаб споживання Token визначає обсяг цінності.

Інакше кажучи, чим сильніші можливості моделі, тим вища її незамінність у ключових сценаріях, а отже й більший простір для торгів щодо ціни. І лише коли модель реалізує масове, тривале використання й формується стабільне споживання Token, комерційна цінність може бути справді втілена в реальність. Отже, видно, що комерційна цінність AGI — це, по суті, результат спільної дії інтелектуального верхнього порогу та масштабу споживання Token.

**Коли Token стає новою валютою,**Zhipu пропонує нову систему оцінювання цінності AI

Поглянувши на першу річну фінансову звітність Zhipu, неважко помітити, що позитивний “вічний двигун” (flywheel) навколо MaaS уже прискорено формується. Конкретно кажучи, зі зростанням можливостей моделей це приваблює більше корпоративних клієнтів і розробників. Збільшення масштабу підключень підсилює обсяг викликів Token і стимулює зростання доходу. А стале зростання доходу, у свою чергу, може відшкодовувати навчання моделей і інвестиції в обчислювальні потужності, ще більше посилюючи можливості моделей. Таке циклічне нарощування створює самопідсилювальний замкнений контур зростання.

У цьому MaaS-“маховику” найбільш критичною змінною є саме безперервне підвищення можливостей моделей. Zhipu раніше заявляла, що підвищення інтелектуального верхнього порогу — це єдина “першопричина” у епоху великих моделей і навіть загального штучного інтелекту.

За останній рік базові моделі Zhipu загалом виконали понад 5 важливих ітерацій, реалізувавши безперервну еволюцію від GLM-4.5 до GLM-5-Turbo. У авторитетних рейтингах оцінювання, таких як Artificial Analysis, моделі серії GLM входять до світового “першого ешелону”, поступаючись лише таким передовим моделям, як Google Gemini, OpenAIGPT, AnthropicClaude тощо, водночас випереджаючи багато вітчизняних моделей.

Більш помітна зміна полягає в тому, що моделі серії GLM розвиваються від “орієнтації на знання” до “орієнтації на завдання”. Тепер вони не обмежуються довідниковими базами знань у форматі запитань-відповідей, а мають можливості агентів, які здатні незалежно виконувати складні завдання. GLM-5 є продуктом змін у тренді “Agentic Engineering”. За офіційним описом, GLM-5 досягла SOTA-показників у здібностях до Coding та Agent, і відчуття від використання в реальних сценаріях програмування вже наближаються до Claude Opus 4.5; особливо добре модель працює з складними інженерними системами та довготривалими агентними задачами.

Новітня GLM-5-Turbo, яку нещодавно запустили в цьому місяці, позиціонується як “базова модель, оптимізована для глибоких сценаріїв OpenClaw для омарів”. Під час тренування ця модель вже спеціально оптимізувалася під ключові вимоги задач для омарів, посилюючи такі базові можливості, як виклик інструментів, дотримання інструкцій, таймінг і тривалі завдання, виконання довгих ланцюжків тощо — ефективно вирішуючи багато проблем, з якими стикаються універсальні моделі в реальних сценаріях для омарів.

Нещодавно у Китаї та за кордоном у хвилю розгортання увірвався проєкт OpenClaw з відкритим кодом для агентів. Але через відносно високий поріг для локального розгортання OpenClaw і дуже високі витрати на Token, багато користувачів обирають “one-click deploy” рішення від вітчизняних хмарних провайдерів і компаній-розробників моделей. У цій хвилі, зокрема, виграє і Zhipu та інші компанії базових моделей.

10 березня Zhipu офіційно запустила AutoClaw (Ав-лон), визначивши її як “першу в Китаї справжню локальну версію OpenClaw, встановлену за один клік”. AutoClaw інкапсулює 50+ популярних Skills та API й підтримує one-click підключення до інструментів миттєвих комунікацій, зокрема Feishu. На найбільшій у світі платформі агрегації API для AI — OpenRouter — у GLM-5-Turbo обсяг викликів цього тижня сягнув 9,66 трлн Token, і модель посідає місця в топ-10 у світі. Zhipu вже стала одним із виробників із найвищими платними витратами Token на внутрішньому ринку.

Token дедалі більше перетворюється на “нову валюту” в епоху інтелектуальної економіки. Як мінімальна одиниця для обробки інформації моделлю, обсяг викликів Token у галузі зазвичай розглядають як ключовий показник активності моделі та реального масштабу обробки. Засновник і CEO Nvidia Дженсен Хуанг прямо заявляв, що Token — це “новий товар великого обсягу”, а Alibaba також створила нову бізнес-вертикаль з Token Hub як ключовою лінією. Паралельно нове покоління складних Agent, представлене OpenClaw, переводить споживання Token у фазу експоненційного зростання, сигналізуючи про прискорення появи нової парадигми, де Token різко збільшується.

На тлі швидкого розширення масштабу споживання Token галузі також потрібен новий фреймворк, щоб оцінювати, як Token ефективніше перетворюється на реальну цінність. У цьому контексті Zhipu запропонувала концепцію “Token архітектурної сили” (TAC) і визначила її так: TAC = кількість викликів інтелекту × якість інтелекту × ефективність перетворення на економічну цінність.

Зокрема, “кількість” означає кількість Token, які підприємства та індивідуальні користувачі викликають щодня, а також масштаб завдань, які передають на обробку AI. “Якість” вимірює, чи модель, на якій тримаються Token, є достатньо розумною та надійною, чи може в складних сценаріях видавати результати, які можна здати в експлуатацію. А “ефективність” фокусується на тому, чи вдається знайти правильні сценарії, щоб AI справді трансформувався в економічний результат, який можна виміряти.

У довгостроковій перспективі ключові конкурентні переваги організацій і окремих людей усе більше залежатимуть від рівня їхнього TAC. На відміну від суто постачальників великих моделей, Zhipu прагне будувати інфраструктуру TAC для всього суспільства — допомагати різним організаціям і індивідам ефективно планувати й використовувати інтелектуальні ресурси, а також безперервно перетворювати їх на практичну, вимірювану економічну цінність.

І цей шлях розвитку вже отримав попереднє підтвердження у нещодавно оприлюдненій фінансовій звітності Zhipu. Якщо озирнутися назад, головний сенс цього звіту, можливо, полягає в тому, що Zhipu показала відносно чітку й внутрішньо узгоджену логіку зростання: через безперервне підвищення інтелектуального верхнього порогу поступово підсилюється цінова спроможність; це, своєю чергою, стимулює зростання доходу від API; а також постійно оптимізується вся структура валової маржі — відтак підтверджується й сталий характер комерційної моделі.

Якщо розглядати з перспективи “Anthropic у китайському форматі”, логіка оцінювання (valuation) Zhipu більше не повинна бути прив’язана до старих рамок традиційних софтверних компаній чи проєктних компаній; натомість слід перейти до системи оцінювання, де в центрі MaaS-платформа: особлива увага має приділятися проникненню платформи (platform penetration), масштабові споживання Token і здатності контролювати екосистему, яку за TAC уособлює. У цій абсолютно новій системі координат довгостроковий простір уявлень (imagination space) для Zhipu тільки-но по-справжньому відкривається.

GLM-4,93%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити