За ростом на 31.8% стоит ли понять, что продажа API компанией Чжипу прошла успешно?

文/阿奇

Вчера Zhipu объявила результаты за весь 2025 год, что также стало её первым финансовым отчётом после выхода на биржу.

За весь год выручка составила 724 млн юаней, рост на 131,9%; однако из-за того, что объём НИОКР достиг 3,18 млрд юаней, скорректированный чистый убыток составил 3.18B юаней.

Хотя убыток получился таким большим, реакция рынка оказалась очень позитивной. Сегодня акции Zhipu выросли на 31,8%.

Среди причин одной из самых важных является то, что продажа API, похоже, наконец-то “заработала”.

В 2025 году выручка от продажи API выросла с 48M юаней в 2024 году до 190M юаней, рост на 296%. Одновременно руководство Zhipu на телефонной конференции прямо указало, что текущая API-сервисная ARR составляет около 250 млн долларов, и что к концу года она, как ожидается, достигнет 1 млрд долларов.

Ещё важнее то, что это не единичный случай. В других компаниях, работающих с большими моделями, мы также постепенно видим похожую тенденцию: объёмы Token-запросов растут, а API становится одним из самых прямых путей монетизации.

Так как же нам следует смотреть на это явление? Сегодня мы разберём его, опираясь на финансовый отчёт Zhipu.

/ 01 /

Рост базовых моделей — через продажу API

В этом финансовом отчёте Zhipu самое заслуживающее внимания изменение — это сдвиг в структуре выручки.

Облачное развертывание стало самым core-источником роста. Под “облачным развертыванием” по сути понимается API-сервис. В 2025 году эта часть дохода выросла с 48M юаней в 2024 году до 1,9 млрд юаней, рост на 296%; доля выручки также увеличилась с 15,5% до 26,3%.

Рост API основан на логике увеличения объёма вызовов.

А за этим стоит продвижение OpenClaw. Когда Agent начинает автоматически выполнять задачи, один запрос зачастую соответствует нескольким раундам вызовов, потребление Token многократно возрастает, и объёмы API-вызовов, соответственно, растут.

Постепенно за этим формируется отраслевой консенсус: когда большие модели обретают способность выполнять задачи на больших расстояниях (long-range task execution), вызовы перестают ограничиваться единичными вводом-выводом и превращаются в устойчивый системный процесс.

В такой структуре сам Token становится самым прямым и наиболее определённым расчётным единичным показателем для тарификации.

Иными словами, когда возможности модели достаточно сильны, само API начинает сходиться к самой ясной коммерческой модели для больших моделей.

Эта тенденция всё больше превращается в общий выбор производителей больших моделей.

За рубежом это произошло раньше. Приблизительно 80% выручки Anthropic поступает от корпоративных API-вызовов — по сути это система тарификации, построенная вокруг потребления Token.

Внутри страны тоже быстро движутся к такой структуре.

На данный момент у ведущих компаний базовых моделей в Китае, таких как Zhipu AI, MiniMax и у компаний, относящихся к “лунной тьме” (月之暗面), ключевая выручка постепенно сходится к API-вызовам; MaaS (Model as a Service) становится основной траекторией, поддерживающей рост.

Руководство Zhipu на телефонной конференции прямо упомянуло, что текущая API-сервисная ARR составляет около 250 млн долларов, и что к концу года она, как ожидается, достигнет 1 млрд долларов. В будущем компания также будет сильнее фокусироваться на стандартизированных API-сервисах. К 2026 году, как ожидается, API-сервисы и локальное развертывание будут делиться примерно поровну; а далее в течение 2–3 лет акцент будет ещё больше смещаться в сторону API.

Похожие изменения происходят и в MiniMax.

В 2025 году выручка от открытой платформы и корпоративных сервисов достигла 190M долларов, рост на 197,8%; доля выручки увеличилась с 28,6% до 32,8%.

По состоянию на февраль 2026 года ARR компании уже превысила 150 млн долларов; по сравнению с 79 млн долларов за финансовый год 2025 это означает удвоение роста. Главный драйвер роста также связан с ростом потребления Token, особенно с расширением сценариев для кодового ассистента и агентов (Agent).

Goldman Sachs прогнозирует, что доля выручки MiniMax от открытой платформы (API) в 2026 году достигнет примерно 40%.

Схлопывание бизнес-модели больших моделей означает, что и способы оценки стоимости становятся более ясными: от “показателей возможностей” к “измерению Token”.

/ 02 /

За дифференциацией маршрутов стоят две стратегии решения

По мере того как AI переходит в стадию приложений, один вопрос начинает становиться конкретным: какова ключевая конкурентоспособность больших моделей, если возможности постепенно сходятся?

По этому вопросу Zhipu и MiniMax предложили два разных решения.

Логика Zhipu — стремиться к максимальному верхнему пределу модели.

Чжан Пэн выдвинул концепцию TAC (Token Architecture Capability, Token-архитектурные возможности); по сути, её можно разложить на три пункта: масштаб вызовов, качество вызовов и способность конвертировать это в выручку.

Её ключевой вывод таков: качество интеллекта определяет право на установление цен.

Оценка Zhipu звучит так: “По мере эволюции Agent Token будет разделяться по слоям: low-complexity и стандартизированные token будут уходить в низкие цены и даже в бесплатные, тогда как только high-complexity и высоконадёжные токены высокого качества будут сохранять право на устойчивое ценообразование”.

Этот момент уже отражён в данных. В первом квартале цена API Zhipu выросла на 83%, но спрос не сократился; напротив, проявилась нехватка предложения, а объёмы вызовов выросли на 400%.

Если Zhipu AI рассказывает историю про “качество определяет право на установление цен”, то MiniMax — фактически про другую логику: конкурентоспособность модели исходит из “различий в пути” и “эффективности”.

MiniMax выбрала не совсем популярный маршрут — параллельное развитие полно-модального собственного направления, где текст, видео, голос и музыка идут в унисон. Это сейчас нечасто встречается среди производителей больших моделей.

Главный смысл этого пути не в “количестве”, а в “широте”.

По мнению Янь Цзюньцзе, ценность платформенных компаний в эпоху AI по сути равна: плотность интеллекта × пропускная способность Token.

Значение мультимодальности в том, что она позволяет увеличить пропускную способность Token, не снижая существенно плотность интеллекта. Потому что меняется не верхний предел возможностей, а порог использования.

Когда в продукт добавляются способы взаимодействия вроде изображений и голоса, затраты на понимание пользователей и пороги операций заметно снижаются, и пользовательская аудитория расширяется на большее количество людей — включая пожилых и детей, то есть на те группы, которые раньше было трудно охватить.

На самом деле это уже происходило в мобильном интернете: от лент с информацией из текста и изображений до взрывного роста коротких видео — по сути в основе было снижение порога взаимодействия, что приводило к скачку проникновения.

Посмотрим дальше на эффективность. Другая главная линия MiniMax — предельная эффективность использования ресурсов.

В 2025 году компания вложила в разработку 253 млн долларов, рост на 33,8%, что заметно ниже темпа роста выручки 158,9%.

В сравнении стратегия Zhipu AI ближе к “делай ставку на удар сверху”.

В 2025 году выручка Zhipu составила 724 млн юаней; при этом расходы на НИОКР — 3,18 млрд юаней, а ставка расходов на НИОКР достигла 439%; в тот же период у MiniMax выручка была 540 млн юаней, расходы на НИОКР — 25.96M юаней, ставка расходов на НИОКР — 323%.

По операционной эффективности: на каждые 1 юань выручки, полученной Zhipu, приходится около 4,4 юаня убытка; у MiniMax — 3,2 юаня. По эффективности работы с персоналом: у Zhipu около 660 тыс. человеко-единиц, а у MiniMax — 1,26 млн.

Конечно, часть различий связана с бизнес-моделью: MiniMax больше полагается на выручку от продуктов, тогда как Zhipu по-прежнему делает упор на локальное развертывание.

Но даже с учётом этого, дифференциация двух маршрутов всё равно отчётлива:

с одной стороны — погоня за “верхним пределом интеллекта”, получение права на ценообразование за счёт повышения возможностей;

с другой стороны — оптимизация “эффективности и охвата”, увеличение масштаба использования и усиление пропускной способности Token.

По сути, это один и тот же формульный подход, но два совершенно разных способа решения.

/ 03 /

Олигополистическая структура — вот максимальная определённость бизнеса базовых моделей

Если не говорить про оценку, бизнес производителей моделей на самом деле уже начинает приобретать относительно ясные очертания.

Этот бизнес базовых моделей не похож на традиционное ПО.

Традиционное ПО — это высокие инвестиции на старте и медленное возвращение средств позже, но базовые модели другие: их затраты растут ступенчато, а выручка может при этом не становиться толще синхронно; напротив, в условиях усиления конкуренции её могут постоянно сжимать.

С этой точки зрения это больше похоже на структуру “врождённо уязвимую”. Но, что интересно, эта структура как раз указывает на другой результат:

она естественным образом ведёт к олигополии.

Потому что только очень немногие компании способны постоянно выдерживать инвестиции такого уровня. По форме бизнеса это больше похоже на батареи или заводы по производству полупроводников (晶圆厂): на старте требуются огромные вложения, но если занять удачную позицию (успеть закрепиться), конкурентов становится немного, а “пирог” достаточно большой.

Одновременно у больших моделей есть ещё одно более тонкое отличие: это не совсем рынок “победитель забирает всё”, а скорее рынок с сегментацией по слоям.

На самом верхнем уровне модели даже преимущество в эффективности всего в 5% в сложных сценариях, ориентированных на скорость и эффективность, например coding, мультиплицируется до премии более чем 50% — эффект множителя задаёт математика.

Но при этом не все задачи требуют самой сильной модели.

Поэтому рынок естественным образом сегментируется: верхний слой забирает премию, средний гонит масштабы, нижний закрывает спрос длинного хвоста. Более того, между разными слоями может даже возникать некая “текучесть Token” — сложные задачи уходят наверх, простые — вниз.

Даже если вы не можете сделать глобально SOTA, но достигнете SOTA в каком-то конкретном узком сегменте — это тоже рабочий путь.

И в этой структуре эффективность — это также крайне важная переменная.

Потому что в этом секторе почти нет сетевых эффектов, а стоимость переключения для пользователей очень низкая. Это означает: если какая-то компания может сделать модель примерно “на 90 баллов”, но при этом по более низкой цене, она сможет быстро нарастить объёмы.

В этом процессе эффективность станет важной переменной и для коммерциализации.

Раз нет сетевых эффектов, стоимость переключения низкая; достаточно, чтобы компания смогла сделать модель “на 90 баллов” и при этом поставить цену ниже — и объёмы сразу начнут быстро расти.

Причина довольно прямая: в части сценариев не требуется самая сильная модель. Когда разница по качеству ограничена, цена становится решающим фактором.

А за ценой по сути стоит стоимость. Это определяется не только технологией, но и различиями в целом ряде затрат, включая вычислительные мощности и электроэнергию.

Например, в Китае за счёт инженерных оптимизаций, масштабного развертывания и более низкой стоимости электроэнергии можно существенно снизить затраты на инференс. Благодаря этому модели с одинаковыми возможностями можно предоставлять внешним клиентам Token-сервисы по более низкой цене.

Сейчас часть китайских компаний моделей, выходящих на зарубежные рынки, по сути ведёт бизнес “ценового спреда Token”.

Разумеется, источником роста доходов являются взрывной спрос и олигополистическая рыночная структура, но этим нельзя слишком оптимистично ограничиваться: из-за различий в конкурентной среде Китай и США в продаже API всё ещё имеют много отличий:

например, в США экосистема больших моделей сильнее опирается на длинный хвост спроса со стороны разработчиков; корпоративные клиенты и разработчики охотнее платят за возможности, и характеристики модели легче напрямую преобразуются в ценовую премию.

А в Китае вызовы концентрируются больше в головных клиентах — включая интернет-платформы и госкомпании — плюс конкуренция со стороны поставок; поэтому ценовая премия Token вряд ли сможет долго сохраняться.

В некотором смысле, в США базовые модели ближе к сочетанию ПО и платформы, а в Китае — больше похоже на часть инфраструктуры.

С этой точки зрения, насколько далеко сможет продвинуться бизнес-модель китайских компаний больших моделей, возможно, ещё придётся понаблюдать.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить