Zhipu court à toute vitesse tout en perdant du sang

GateUser-bd883c58 · 2026-03-31T23:58:41+00:00

问AI · 智谱研发投入远超收入，这种模式能否持续？出品｜虎嗅科技组作者｜宋思杭编辑｜苗正卿头图｜视觉中国如果有一门生意，“每赚 1 元收入，要投入4.4 元研发费”，它会是门好生意吗？全球大模型第一股智谱AI（下称“智谱”）试图回答这一问题。2026年3月31日，智谱公布了2025年全年业绩，这也是其上市后的首份财报。财报显示，智谱在2025年全年实现总收入7.24亿元人民币，同比增长131.9%；销售成本，同比增长213.3%至4.27亿元。在这样的收入和成本表现下，智谱的毛利同比增长68.7%至2.97亿元，公司全年综合毛利率也达到了41%。而对于同样是

GateUser-bd883c58

2026-03-31 23:58:41

Demande à l’IA · Les investissements en R&D de Zhipu dépassent largement ses revenus : ce modèle peut-il durer ?

Publié par｜Équipe Tech de Huxiu

Auteur｜Song Sihang

Éditeur｜Miao Zhengqing

Image de couverture｜China Vision

S’il existe une affaire où, pour chaque 1 yuan de revenus gagnés, il faut investir 4,4 yuans en frais de R&D, est-ce une bonne affaire ?

Zhipu AI, la première société de grands modèles cotée en bourse en tant que « première grande société de modèles » (ci-après « Zhipu »), tente de répondre à cette question. Le 31 mars 2026, Zhipu a publié ses résultats annuels pour 2025, ce qui constitue également son premier rapport financier depuis son introduction.

D’après le rapport, Zhipu a réalisé en 2025 un chiffre d’affaires total de 724 millions de yuans, soit +131,9 % sur un an ; le coût des ventes a augmenté de 213,3 % pour atteindre 427 millions de yuans. Avec de tels résultats en revenus et en coûts, la marge brute a progressé de 68,7 % sur un an pour atteindre 297 millions de yuans, et la marge brute globale de l’entreprise a également atteint 41 % sur l’année. En revanche, pour MiniMax, également une entreprise cotée de grands modèles, la marge brute de Zhipu est déjà nettement supérieure à celle de MiniMax, qui se situe à 25,4 %.

Si l’on analyse la structure des revenus, derrière une marge brute de 41 % se dessine une tendance à la divergence : la marge brute de l’activité de déploiement local est passée de 66,0 % en 2024 à 48,8 % en 2025, tandis que la marge brute de l’activité de déploiement sur le cloud est passée de 3,3 % en 2024 à 18,9 % en 2025. (Note de Huxiu : le déploiement local désigne le déploiement de grands modèles en local ; le déploiement sur le cloud désigne la plateforme ouverte et les API). À cet égard, Zhipu a déjà prouvé pleinement son potentiel de rentabilité.

Mais elle reste en pertes.

Sous l’effet des 3,18 milliards de yuans de frais de R&D sur la même période, la perte nette ajustée de Zhipu atteint 3,182 milliards de yuans, avec une hausse de 29,1 % sur un an. Sur la même période, le montant des pertes représente 4,39 fois le chiffre d’affaires total de Zhipu, et même 10,7 fois sa marge brute. Il convient de noter que les pertes proviennent principalement des dépenses de R&D. D’après le rapport financier, en 2025 les coûts de R&D de Zhipu s’élèvent à 3,184 milliards de yuans, soit +44,9 % ; et les dépenses en capital (capex) en 2025 s’élèvent à 74,70 millions de yuans.

Le rapport explique que l’augmentation des coûts de R&D provient principalement de :

（1）l’augmentation des coûts des employés, y compris l’élargissement des équipes de R&D et la hausse des dépenses liées aux paiements en actions ;

（2）les frais de services de calcul payés à des fournisseurs tiers de capacité de calcul, y compris pour l’itération des modèles et l’investissement dans des infrastructures d’entraînement de modèles plus avancées.

Il faut toutefois souligner un point : les coûts de capacité de calcul utilisés pour l’entraînement des grands modèles ne sont pas inclus dans les dépenses de R&D, mais comptabilisés séparément comme dépenses en capital sous la forme de location de capacité de calcul. Dans le contexte de Zhipu, le premier poste correspond aux coûts de GPU facturés par les fournisseurs de capacité de calcul selon la durée d’entraînement du modèle : ces dépenses flexibles sont comptabilisées dans les coûts de R&D. En revanche, le fait de verrouiller des ressources GPU, et de signer un contrat à long terme avec un fournisseur, est comptabilisé comme dépenses en capital.

En comparant avec MiniMax, la taille globale de Zhipu est plus grande. Cela tient principalement à des différences dans la composition des activités et l’organisation des deux sociétés. Par exemple, la taille des effectifs de Zhipu est le double de celle de MiniMax, ce qui entraîne aussi des coûts de R&D plus élevés et des pertes plus sévères ; tandis que l’autre société affiche une meilleure efficacité par employé.

Société	Zhipu (02513.HK)	MiniMax (00100.HK)
Chiffre d’affaires total	724 millions de yuans	540 millions de yuans (79,038 millions USD)
Marge brute	41,0 %	25,4 %
Perte nette ajustée	3,182 milliards de yuans	1,730 milliard de yuans (251 millions USD)
Investissement en R&D	3,180 milliards de yuans	1,743 milliard de yuans (253 millions USD)
Taille du personnel	883 employés (au 2025 mi-année)	385 employés (au 2025 septembre)
Perte pour 1 yuan de revenus	4,4 yuans	3,2 yuans
Capitalisation boursière (2026.3.31)	3092 HKD	291,5 milliards HKD

Le point à noter dans ce rapport financier est que, comme MiniMax, Zhipu a également « goûté la prime de la langouste ».

À partir du premier trimestre 2026, la croissance des performances de Zhipu dépend principalement de son AutoClaw lancé en mars, qui déploie la langouste en un clic.

D’après l’explication du PDG de Zhipu, Zhang Peng, la tarification des appels d’API de Zhipu a augmenté de 83 % au cours du trimestre. Mais il a aussi coïncidé précisément avec le moment où la demande a explosé. À ce moment-là, la popularité de la langouste avait déjà duré depuis un mois. Pendant la demi-semaine qui a suivi la hausse des prix, Zhipu a commencé à déployer la langouste. Ainsi, même avec une croissance des prix, le volume d’appels du modèle GLM de Zhipu a continué d’augmenter de 400 %. Selon le rapport financier, deux jours après le lancement du plan, le nombre d’utilisateurs abonnés dépassait 100 000 ; après 20 jours, il a dépassé 400 000.

En face, les indicateurs de capacité bénéficiaire, c’est-à-dire l’accent mis par Zhipu sur la plateforme MaaS. D’après les informations disponibles, la plateforme d’API MaaS a généré un ARR de 1,7 milliard de yuans (environ 250 millions USD), soit une hausse de 60 fois sur un an.

Autrement dit, avec cette publication, Zhipu prouve d’un côté son espace de rentabilité, mais de l’autre, les pertes ne s’arrêtent pas.

La logique de croissance de Zhipu a changé, mais pas encore été restructurée

En termes de structure globale des revenus, le variable le plus clé dans ce rapport financier n’est en réalité pas le chiffre d’affaires total lui-même, mais la source des revenus. En décortiquant les variations subtiles dans les sources de revenus, on peut discerner la nouvelle logique de croissance de Zhipu et sa durabilité.

En regardant de plus près, l’axe de croissance de Zhipu s’est déjà déplacé vers le cloud, autrement dit vers MaaS. Cette partie représente 26,3 % ; en 2024, le déploiement sur le cloud ne représentait que 15,5 % du chiffre d’affaires total. Après la publication de ce rapport financier, Zhipu a également affirmé que ses priorités stratégiques continueront de se concentrer sur MaaS.

Cependant, même si, en chiffres, la part du déploiement sur le cloud a fortement augmenté, plusieurs variables y sont particulièrement critiques.

D’abord, le moteur le plus central provient des API. Autrement dit, cette phase de croissance de Zhipu, dans l’essentiel, est une croissance du volume d’appels.

Parmi ces éléments, la langouste (OpenClaw) est la variable la plus directe. Avec l’Agent commençant à exécuter automatiquement des tâches, un besoin correspond souvent à plusieurs cycles d’appels ; la consommation de tokens est multipliée, et le volume d’appels API augmente en conséquence.

Deuxième point : la principale source de revenus de MaaS. Le rapport indique que, sur les dix entreprises Internet, neuf ont déjà intégré le modèle de Zhipu.

Il y a ici un changement à noter : ces entreprises Internet ont quasiment toutes leurs propres grands modèles, mais elles ne dépendent pas entièrement de leurs modèles internes ; elles appellent différents modèles selon les besoins de leurs activités. Autrement dit, même si elles disposent de grands modèles développés en interne à court terme, elles choisiront quand même Zhipu dans des scénarios spécifiques. Bien sûr, cela ne signifie pas que ces neuf grandes entreprises Internet choisiront cette stratégie sur le long terme.

Et les volumes d’appels de ces entreprises occupent essentiellement la moitié de l’activité de revenus MaaS de Zhipu. Autrement dit, si Zhipu perd n’importe lequel de ses clients, cela portera un coup dur à l’activité MaaS actuelle.

Troisième point : la croissance de MaaS vient aussi de l’« exportation » des tokens. Au cours de l’année passée, Zhipu a coopéré avec plusieurs pays du Moyen-Orient et d’Asie du Sud-Est, en exportant localement ses capacités de modèles. Dans l’essentiel, il s’agit également de générer des revenus sous forme d’appels à des tokens.

En synthèse, le signal clair libéré par ce rapport financier est que Zhipu est en train de passer le récit de sa croissance : de la relocalisation/déploiement local vers la vente de modèles, c’est-à-dire la vente de tokens.

Mais les résultats montrent qu’en dépit du fait que, pour l’instant, les revenus principaux de Zhipu dépendent toujours du déploiement local, le modèle MaaS présente une tendance à une croissance durable.

Sur cette base, Zhipu a aussi proposé un nouveau concept : TAC (Token Architecture Capability, capacité d’architecture de tokens).

Selon sa définition, le TAC se compose de trois éléments : l’appel intelligent (volume), la qualité intelligente, et l’efficacité de conversion économique. En termes simples : combien de tokens sont appelés, si ces appels sont efficaces, et si, au final, ils peuvent être convertis en revenus.

À mon avis, après l’événement « langouste », l’industrie a progressivement convergé vers un consensus sur les tokens : lorsque les grands modèles disposent de la capacité d’exécuter des tâches sur de longues durées, les appels ne sont plus un simple aller-retour entrée/sortie unique, mais organisés comme un système fonctionnant en continu.

Ainsi, derrière une tâche, il y a souvent plusieurs cycles d’appels, des appels d’outils, voire une auto-vérification ; les tokens ne sont plus seulement consommés, ils sont « orchestrés », c’est-à-dire la façon dont l’utilisateur organise les appels au grand modèle.

Et pourquoi le TAC est proposé à ce moment-là n’est pas difficile à comprendre.

Au cours des deux dernières années, la compétition dans l’industrie des grands modèles s’est surtout concentrée sur la taille des paramètres, les capacités du modèle et le prix ; mais à mesure que la guerre des prix touche à sa fin et que les capacités des modèles se rapprochent, l’explosion des applications Agent rend ces indicateurs de moins en moins capables d’expliquer les différences de croissance entre les entreprises.

Dans ce contexte, Zhipu a besoin d’un nouvel ensemble d’indicateurs pour répondre à une question plus réaliste : lorsque les capacités des modèles diffèrent peu, d’où vient la croissance ?

Le « piège des coûts » de Zhipu

En élargissant la perspective de Zhipu à l’ensemble de l’industrie, on constate que le modèle commercial des grands modèles commence à converger.

À part la société « Step Star » (阶跃星辰), les trois autres entreprises de modèles de base voient leurs revenus principaux se concentrer vers les appels API.

Que ce soit Zhipu, MiniMax ou le côté « Moons Dark » (月之暗面), tous suivent la voie consistant à faire porter la croissance par MaaS. Mais au moins pour Zhipu, ce chemin n’existait pas au début.

Prenons l’exemple de Zhipu : dans ses activités initiales, la part de ToG et de déploiement privatisé était très élevée, avec une forte caractéristique « projet ». Ce n’est qu’environ à la moitié d’une année avant son introduction en bourse, afin que le modèle commercial soit plus durable et que l’espace d’imagination de l’échelle soit plus grand, que Zhipu a commencé à se transformer clairement vers MaaS, déplaçant l’axe de croissance vers les appels API cloud.

D’après les résultats, cette transformation a bien entraîné des changements : la part MaaS a augmenté, le token est devenu l’indicateur central, et la structure des revenus a commencé à se rapprocher d’une logique de plateforme.

Cependant, selon l’architecture actuelle de Zhipu, une structure où le déploiement local dépasse le déploiement sur le cloud est difficile à changer rapidement.

La croissance actuelle de MaaS dépend encore fortement de quelques gros clients.

Le rapport financier montre qu’une part substantielle des revenus API de Zhipu provient d’entreprises Internet de premier plan. Bien qu’elles disposent de modèles développés en interne, dans leurs activités concrètes elles choisissent d’appeler des capacités de modèles externes. Ce modèle de « multi-modèles » fournit effectivement une demande stable pour MaaS. Le problème est que cela ne correspond pas à une croissance véritablement « scalable ».

D’une part, les clients de tête contribuent à l’essentiel du volume d’appels ; d’autre part, le marché de la longue traîne n’a pas encore été réellement ouvert. Autrement dit, la forme plateforme de MaaS est apparue, mais elle n’a pas encore établi une échelle de plateforme.

Et cela pointe aussi vers un autre problème plus fondamental : le coût par token et la structure des revenus.

Le rapport financier indique qu’en 2025 la perte annuelle de Zhipu s’est élevée à 4,718 milliards de yuans, soit +59,5 % ; dont les dépenses de R&D atteignent 3,18 milliards de yuans, soit +44,9 % ; les dépenses en capital à 74,70 millions de yuans, soit environ -83,8 % en glissement annuel. Le premier poste concerne les coûts d’entraînement du modèle et les coûts des employés ; le second provient de coûts tels que la location de capacité de calcul, etc. En 2025, Zhipu a ajusté sa manière d’acquérir la capacité de calcul : la location de capacité auparavant plutôt fixe a été transformée en un modèle combinant location de capacité de calcul et achat de services ; c’est pourquoi les dépenses en capital ont fortement diminué.

Alors, en reliant la croissance de MaaS à ces deux séries de données, on peut observer une chaîne logique très directe :

si l’entreprise veut stimuler la croissance de MaaS, elle doit dépendre des capacités de modèle ; or l’amélioration des capacités de modèle nécessite d’augmenter continuellement les investissements en R&D. Mais le problème est que les coûts de R&D et de capacité de calcul ne baisseront pas naturellement à mesure que le volume d’appels s’élargit.

Autrement dit, la croissance des revenus elle-même repose sur une hausse des coûts.

Cela plonge les entreprises de grands modèles dans une impasse structurelle : pour obtenir plus d’appels, il faut améliorer continuellement les capacités du modèle ; et pour améliorer les capacités du modèle, il faut augmenter encore et encore les investissements.

Résultat : plus la croissance est rapide, plus la pression sur les coûts est élevée.

Sous cet angle, le problème ne concerne plus seulement Zhipu, mais des contraintes communes auxquelles l’ensemble de l’industrie des grands modèles fait face.

Tant que ce problème n’a pas été résolu, MaaS peut apporter de la croissance, mais il est difficile d’apporter des profits.

Pourquoi Zhipu veut se comparer à Anthropic ?

Lors de la conférence téléphonique de présentation des résultats annuels le soir du 31 mars, avant même de faire son rapport sur les performances, le PDG de Zhipu, Zhang Peng, a spécifiquement mentionné la licorne américaine de l’IA, Anthropic, dont l’ARR est passé de 1 milliard de dollars fin 2024 à 9 milliards de dollars fin 2025.

En réalité, presque toutes les principales entreprises de grands modèles tentent de suivre la voie américaine.

Par exemple, le côté « Moons Dark » a tourné son regard vers OpenAI et suit la voie « capacités du modèle + produit + abonnement » ; tandis que Zhipu et MiniMax cherchent à s’approcher du modèle d’Anthropic, en mettant l’accent sur les capacités du modèle de base : via les API, elles restituent la puissance d’inférence et construisent un écosystème développeurs.

Quelle que soit la voie choisie, au fond il s’agit de faire du modèle une infrastructure, puis de réaliser des revenus à grande échelle grâce aux appels.

À l’heure actuelle, cette voie a déjà été validée à un stade préliminaire aux États-Unis. Qu’il s’agisse d’OpenAI ou d’Anthropic, on peut montrer que lorsque les capacités de modèle sont suffisamment fortes, l’écosystème développeurs peut créer une boucle de rétroaction positive. Le problème est qu’en Chine, il est difficile de répliquer ce chemin.

D’abord, il y a la différence de système de prix.

Sur le marché américain, les clients d’entreprise et les développeurs sont davantage prêts à payer pour les capacités : celles-ci peuvent se transformer en prime (pricing premium). Mais en Chine, les prix ont été compressés rapidement dès le départ. Après deux ans de guerre des prix, le token n’a progressivement évolué que vers une « ressource de base ».

Ensuite, la différence de structure de la demande.

L’écosystème des grands modèles aux États-Unis dépend davantage des besoins de la longue traîne des développeurs ; en Chine, les appels sont davantage concentrés chez des clients de tête, comme les grandes entreprises Internet et les clients gouvernementaux/entreprises publiques. Dans cette structure, MaaS ressemble davantage à un « achat groupé centralisé », plutôt qu’à une croissance entraînée par l’écosystème développeurs.

Troisièmement, la différence de coûts et d’offre. L’offre de puissance de calcul, la structure des puces et l’environnement global des coûts rendent les coûts des entreprises de modèles nationales plus difficiles à réduire à mesure que l’échelle augmente.

Sous cet angle, la situation difficile de Zhipu s’explique plus facilement.

En revoyant la trajectoire du développement d’Internet et du cloud, la rentabilité de la couche d’infrastructure est généralement construite après l’explosion de la couche applicative.

De manière analogue, cela implique qu’à ce stade actuel, que ce soit Zhipu ou d’autres entreprises de grands modèles, il faut attendre que les scénarios d’application soient validés de manière continue, avant qu’il soit possible d’apparaître des effets d’échelle.

GLM1,41%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.