Futures
Accédez à des centaines de contrats perpétuels
TradFi
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Pre-IPOs
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Après une hausse de 31,8 %, l'affaire de Zhipu qui vend des API a-t-elle été conclue ?
Par / Arcy
Hier, Zhipu a publié ses résultats financiers annuels 2025, qui constituent aussi son tout premier rapport financier depuis sa cotation.
Sur l’année, le chiffre d’affaires s’est élevé à 724 millions de yuans, soit une hausse de 131,9 % ; toutefois, tiré par 3,18 milliards de yuans de dépenses de R&D, la perte nette ajustée atteint 3.18B de yuans.
Même si la perte est aussi importante, la réaction du marché a été très positive. Aujourd’hui, le cours de l’action de Zhipu a augmenté de 31,8 %.
Parmi les raisons principales, il y a un élément très important : la vente d’API semble, en apparence, avoir finalement trouvé son modèle.
En 2025, les revenus issus de la vente d’API sont passés de 48 millions de yuans en 2024 à 190 millions de yuans, soit une hausse de 296 %. En même temps, lors de la conférence téléphonique, la direction de Zhipu a indiqué clairement que, pour le moment, l’ARR des services API est d’environ 250 millions de dollars, et que l’entreprise prévoit d’atteindre 1 milliard de dollars d’ici la fin de l’année.
Et plus important encore : ce n’est pas un cas isolé. Dans d’autres entreprises de grands modèles, on observe progressivement des tendances similaires : le volume d’appels de Tokens est en hausse, et les API deviennent l’un des chemins de monétisation les plus directs.
Alors, comment faut-il interpréter ce phénomène ? Aujourd’hui, nous allons en parler en reliant cela au rapport financier de Zhipu.
/ 01 /
Croissance du socle, grâce à la vente d’API
Dans ce rapport financier de Zhipu, le changement le plus digne d’attention est le transfert de la structure des revenus.
Le déploiement dans le cloud est devenu la source de croissance la plus centrale. Par « déploiement dans le cloud », on entend essentiellement les services d’API. En 2025, cette partie des revenus est passée de 48 millions de yuans en 2024 à 190 millions de yuans, soit une hausse de 296 % ; la part des revenus est aussi passée de 15,5 % à 26,3 %.
La croissance des API repose sur l’augmentation du volume d’appels.
Et derrière cela, il y a OpenClaw. Lorsque l’Agent commence à exécuter automatiquement des tâches, une seule demande correspond souvent à plusieurs tours d’appels ; la consommation de Tokens est multipliée, et le volume d’appels d’API augmente en conséquence.
Peu à peu, un consensus industriel s’est formé : lorsque les grands modèles acquièrent la capacité d’exécuter des tâches sur la durée, les appels ne s’arrêtent plus à un simple cycle entrée-sortie, mais évoluent vers un processus systématique pouvant fonctionner de manière durable.
Dans cette structure, les Tokens eux-mêmes deviennent l’unité de facturation la plus directe et la plus sûre.
Autrement dit : lorsque la capacité du modèle devient suffisamment forte, les API elles-mêmes se transforment en modèle commercial le plus clair pour les grands modèles.
Cette tendance est en train de devenir un choix commun pour les fournisseurs de grands modèles.
À l’étranger, cela a commencé plus tôt. Environ 80 % des revenus d’Anthropic proviennent de services d’API en mode entreprise ; au fond, il s’agit d’un système de tarification centré sur la consommation de Tokens.
En Chine, cette structure se rapproche aussi rapidement.
À l’heure actuelle, chez les principaux acteurs chinois des « modèles de base », comme Zhipu AI, MiniMax et le cœur des revenus de la plateforme de Moonshot (Month of the Dark), les revenus se tournent progressivement vers l’API : MaaS (Model as a Service) devient la voie principale pour capter la croissance.
Lors de la conférence téléphonique, la direction de Zhipu a mentionné clairement que l’ARR actuelle des services API est d’environ 250 millions de dollars, avec une prévision d’atteindre 1 milliard de dollars d’ici la fin de l’année. À l’avenir, l’entreprise accordera aussi davantage d’importance à des services API standardisés. D’ici 2026, les services API et le déploiement local devraient représenter chacun environ la moitié ; puis, sur les 2 à 3 années suivantes, le centre de gravité penchera encore davantage vers les API.
Des changements similaires sont aussi observés chez MiniMax.
En 2025, les revenus de sa plateforme ouverte et de ses services aux entreprises ont atteint 25.96M de dollars, soit une hausse de 197,8 % ; la part des revenus est passée de 28,6 % à 32,8 %.
Au 2 février 2026, l’ARR de la société a dépassé 150 millions de dollars ; comparé aux 79 millions de dollars de l’exercice financier 2025, c’est un doublement. Les principaux moteurs de la croissance viennent aussi de l’augmentation de la consommation de Tokens, en particulier avec l’expansion des scénarios d’assistants de codage et d’agents (Agent).
Goldman Sachs estime que, d’ici 2026, la part des revenus de MiniMax issus de la plateforme ouverte (API) atteindra environ 40 %.
Le resserrement des modèles d’affaires des grands modèles signifie aussi que la manière de mesurer la valeur devient plus claire : on passe des « indicateurs de capacité » aux « mesures en Tokens ».
/ 02 /
Derrière la diversification des trajectoires, deux approches pour résoudre le problème
À mesure que l’IA entre dans une phase applicative, une question devient plus concrète : lorsque les capacités des modèles convergent progressivement, quelle est la véritable force concurrentielle des grands modèles ?
Sur cette question, Zhipu et MiniMax proposent deux solutions différentes.
La logique de Zhipu consiste à rechercher le plafond ultime du modèle.
Zhang Peng a proposé le concept de TAC (Token Architecture Capability, Token Architecture Capability) ; fondamentalement, il peut se décomposer en trois points : l’ampleur des appels, la qualité des appels, et la capacité de convertir cela en revenus.
Son jugement central est le suivant : la qualité de l’intelligence détermine le pouvoir de fixation des prix.
Le jugement de Zhipu est : « Avec l’évolution des Agents, les Tokens seront aussi segmentés. Les tokens à faible complexité et standardisés iront vers des prix plus bas, voire gratuits ; seuls les tokens de haute qualité, à haute complexité et haute fiabilité, disposeront d’un pouvoir de fixation des prix durable. »
Cet aspect se reflète déjà dans les données. Au premier trimestre, le prix des API de Zhipu a augmenté de 83 %, mais la demande n’a pas diminué ; au contraire, elle a montré des signes de pénurie : le volume d’appels a augmenté de 400 %.
Si Zhipu AI parle de « la qualité qui détermine le pouvoir de fixation des prix », alors MiniMax, en réalité, explique une logique différente : la compétitivité du modèle vient de la « différenciation des parcours » et de « l’efficacité ».
MiniMax a choisi une trajectoire peu courante : le développement en mode multi-modality avec, en parallèle, quatre grandes modalités—texte, vidéo, voix et musique. À ce stade, ce choix n’est pas fréquent chez les fournisseurs de grands modèles.
Le cœur de cette trajectoire n’est pas d’être « plus », mais d’être « plus large ».
Selon Yan Junjie, la valeur d’une entreprise de plateforme à l’ère de l’IA est, en essence : la densité d’intelligence × le débit (throughput) de Tokens.
Le sens du multi-modal réside dans le fait d’amplifier le débit de Tokens sans réduire significativement la densité d’intelligence. Car ce qu’il change n’est pas le plafond de capacité, mais le seuil d’utilisation.
Lorsque des interactions comme des images et de la voix sont intégrées au produit, les coûts de compréhension et le seuil d’opération pour les utilisateurs diminuent nettement, et la base d’utilisateurs s’étend à des segments plus larges, y compris des personnes âgées et des enfants, c’est-à-dire des groupes qui étaient auparavant plus difficiles à couvrir.
En réalité, ce phénomène s’est déjà produit dans l’Internet mobile : du flux d’informations texte-image, à l’explosion des vidéos courtes—dans l’essentiel, il s’agit de réaliser un bond de pénétration en abaissant les barrières d’interaction.
Regardons maintenant l’efficacité. L’autre axe majeur de MiniMax est une efficacité extrême d’utilisation des ressources.
En 2025, l’investissement R&D de l’entreprise s’est élevé à 253 millions de dollars, soit une hausse de 33,8 %, nettement inférieure à la hausse des revenus de 158,9 %.
En comparaison, la stratégie de Zhipu AI ressemble davantage à une approche « en hauteur et fort ».
En 2025, les revenus de Zhipu se sont établis à 724 millions de yuans, ce qui correspond à des dépenses de R&D de 3,18 milliards de yuans ; le ratio de dépenses de R&D atteint 439 %. Sur la même période, les revenus de MiniMax se montaient à 540 millions de yuans ; les dépenses de R&D à 1.74B de yuans ; et le ratio des dépenses de R&D à 323 %.
En termes d’efficacité opérationnelle : pour chaque 1 yuan de revenus gagné par Zhipu, il correspond environ 4,4 yuans de perte ; pour MiniMax, c’est 3,2 yuans. En termes d’efficacité humaine : Zhipu compte environ 660k personnes, tandis que MiniMax atteint 1,26 million.
Bien sûr, une partie de ces différences provient du modèle économique : MiniMax dépend davantage des revenus produits, tandis que Zhipu reste principalement axé sur le déploiement local.
Mais même ainsi, la divergence entre les deux trajectoires demeure très claire :
D’un côté, on cherche le « plafond intelligent », en gagnant le pouvoir de fixation des prix grâce à l’amélioration des capacités ;
De l’autre, on optimise « l’efficacité et la couverture », en augmentant l’échelle d’utilisation pour amplifier le débit de Tokens.
Au fond, c’est la même formule : deux solutions totalement différentes.
/ 03 /
La structure des oligopoles est la plus grande certitude de l’activité des modèles de base
En mettant de côté la question de l’évaluation, le métier des fabricants de modèles est déjà en train de dessiner un contour relativement clair.
L’activité des modèles de base n’est pas comme les logiciels traditionnels.
Dans les logiciels traditionnels, les investissements initiaux sont élevés, puis le recouvrement se fait lentement par la suite ; mais les modèles de base sont différents. Le coût augmente par paliers, tandis que les revenus ne s’épaississent pas nécessairement en parallèle : au contraire, ils peuvent être comprimés continuellement à mesure que la concurrence s’intensifie.
Sous cet angle, cela ressemble davantage à une structure « intrinsèquement fragile ». Mais ce qui est intéressant, c’est que cette structure pointe paradoxalement vers un autre résultat : elle mène naturellement à des oligopoles.
Car seuls un très petit nombre d’entreprises peuvent continuer à supporter ce niveau d’investissement. Sur le plan de la forme commerciale, cela ressemble davantage à une batterie ou à une usine de wafers : l’investissement initial est énorme ; mais une fois l’emplacement sécurisé, il y a peu de concurrents, et le gâteau est assez grand.
En plus, il y a un autre point plus subtil : dans l’espace des grands modèles, il ne s’agit pas totalement d’un marché « gagnant emporte tout », mais plutôt d’un marché segmenté.
Au sommet, même un modèle n’ayant que 5 % d’avantage d’efficacité, dans des scénarios complexes orientés vers l’efficacité comme le coding, peut voir ce gain être amplifié en une prime de plus de 50 %, effet multiplicateur oblige.
Mais en même temps, toutes les tâches n’exigent pas le modèle le plus puissant.
Ainsi, le marché se segmentera naturellement : la couche supérieure capte la prime, la couche intermédiaire exécute à grande échelle, et la couche de base absorbe les besoins de longue traîne. Et même entre niveaux, il peut se former une sorte de « flux de Tokens » : les tâches complexes vers le haut, les tâches simples vers le bas.
Même si vous ne pouvez pas atteindre un SOTA global, parvenir à un SOTA dans un domaine spécifique reste une voie valable.
Dans cette structure, l’efficacité est aussi un paramètre très critique.
Parce que dans cette industrie, il y a presque aucun effet de réseau, et le coût de changement pour les utilisateurs est extrêmement faible. Cela signifie que tant qu’une entreprise peut produire un modèle « à 90 points », avec en plus un prix plus bas, elle peut rapidement gagner en volume.
Dans ce processus, l’efficacité devient aussi un variable importante de la commercialisation.
Comme il n’y a pas d’effet de réseau, les utilisateurs ont un faible coût de changement. Aussi, tant qu’une entreprise peut produire un modèle « à 90 points » et avec un prix plus bas, elle peut rapidement augmenter son volume.
La raison est très directe : dans certains scénarios, il n’est pas nécessaire d’avoir le modèle le plus fort. Lorsque l’écart de performance est limité, le prix devient le facteur décisif.
Et derrière le prix, il y a le coût. Ce coût ne dépend pas seulement de la technologie : il dépend aussi de tout une série de coûts tels que la puissance de calcul et l’électricité.
Prenons l’exemple de la Chine : grâce à l’optimisation d’ingénierie, au déploiement à grande échelle et à un coût d’électricité plus faible, on peut réduire de manière significative le coût d’inférence. Ainsi, à capacités équivalentes, des modèles peuvent fournir des services de Tokens à un prix plus bas.
À l’heure actuelle, une partie des sorties à l’étranger des fournisseurs de modèles chinois repose, au fond, sur une activité de « différence de prix de Tokens ».
Certes, la croissance des revenus provient de la demande explosive et de la structure oligopolistique du marché ; néanmoins, il ne faut pas être trop optimiste : à cause des différences de l’environnement concurrentiel, la vente d’API entre les États-Unis et la Chine présente encore de nombreuses divergences :
Par exemple, dans l’écosystème américain, les grands modèles dépendent davantage de la demande de la longue traîne des développeurs. Les clients entreprises et les développeurs sont plus enclins à payer pour la capacité, et les performances des modèles se convertissent plus facilement et plus directement en prime.
En Chine, les appels sont davantage concentrés sur les clients de tête, notamment les plateformes Internet et les clients gouvernementaux/entreprises. De plus, avec la concurrence côté offre, la prime des Tokens ne devrait probablement pas exister durablement.
À certains égards, on peut dire que, aux États-Unis, les modèles de base ressemblent davantage à un assemblage de logiciels et de plateformes, tandis qu’en Chine, ils ressemblent plus à une partie des infrastructures.
Sous cet angle, il faudra peut-être encore observer jusqu’où les modèles économiques des entreprises chinoises de grands modèles peuvent réellement aller.