Zhipu augmente ses prix pour la troisième fois cette année, augmentant encore de 10 %, les grands modèles nationaux abandonnent collectivement la guerre des prix

robot
Création du résumé en cours

Pourquoi l’IA · Quelles sont les forces motrices derrière l’abandon collectif de la guerre des prix par les grands modèles nationaux ?

Zhipu repasse à la hausse. Le 8 avril, Zhipu a officiellement publié et open-sourcé son modèle GLM-5.1, la plateforme d’agrégation de modèles OpenRouter indique que le prix de Zhipu GLM a de nouveau augmenté de 10 %. Après cette hausse, le prix par token de cache pour le scénario Coding du GLM-5.1 est proche du niveau de Claude Sonnet 4.6 d’Anthropic. Au moment de la rédaction, Zhipu (2513.HK) a augmenté de plus de 14 % en séance, atteignant 888,5 HKD, avec une capitalisation de marché de 396,1 milliards HKD.

Zhipu a récemment augmenté ses prix trois fois, encore +10 %

C’est déjà la troisième hausse de prix récente de Zhipu. Après le lancement de son nouveau modèle phare GLM-5 le 12 février, Zhipu a ajusté le prix de son forfait GLM Coding Plan, avec une augmentation totale d’au moins 30 %. Le 16 mars, Zhipu a lancé le premier modèle général optimisé en profondeur pour le scénario “Lobster”, le GLM-5-Turbo, et a augmenté le prix de l’API du GLM-5-Turbo de 20 %.

Le 8 avril, la plateforme d’agrégation OpenRouter indique que Zhipu GLM4 a de nouveau augmenté de 10 %. Actuellement, le prix d’entrée du GLM-5 Turbo est de 1,2 USD par million, le prix de sortie de 4 USD par million, et le nouveau GLM-5.1 a un prix d’entrée de 1,26 USD par million, un prix de sortie de 3,96 USD par million. En calculant, le GLM-5.1 voit une hausse de 5 % du prix d’entrée par rapport à la génération précédente, et une légère baisse de 1 % pour le prix de sortie.

Le dernier GLM-5.1 lancé continue de dominer en capacité de programmation, avec une note moyenne globale de 3e dans les trois principaux benchmarks de code SWE-bench Pro, Terminal-Bench, NL2Repo, étant le troisième mondial, le premier national et le premier open source ; dans le benchmark SWE-bench Pro, qui se rapproche le plus du développement logiciel réel, il a même permis au modèle national de dépasser pour la première fois Opus 4.6, établissant un nouveau record mondial.

De plus, contrairement aux modèles actuels principalement interactifs en minutes, le GLM-5.1 peut fonctionner de manière autonome et continue pendant jusqu’à 8 heures dans une seule tâche, ce qui constitue la plus grande nouveauté de cette sortie. Lors de l’exécution, le modèle peut planifier, exécuter, tester de manière autonome, changer de stratégie en cas de difficulté, se réparer lui-même après une erreur, et livrer finalement un résultat complet de niveau ingénierie.

Zhipu a récemment publié son premier rapport annuel depuis sa mise sur le marché. Selon le rapport financier, jusqu’en mars de cette année, le prix d’appel de l’API Zhipu a augmenté de 83 % par rapport à la fin de l’année dernière, mais la demande reste forte. Le PDG de Zhipu, Zhang Peng, a déclaré que de nombreux fournisseurs de services API basés sur la puissance de calcul existent sur le marché, et que l’acceptation par les clients de cette hausse de prix et leur choix continu montrent que la capacité du modèle est effectivement en tête. « Je pense que la valeur à long terme du prix est déterminée par la valeur. Les ressources capables de remplacer efficacement la main-d’œuvre, d’améliorer l’efficacité de conversion et le niveau d’intelligence sont rares et précieuses. Nous nous concentrons davantage sur la valeur créée par chaque token et sur la valeur apportée aux clients. Ce n’est que lorsque les clients reconnaissent cette valeur qu’ils seront prêts à payer un coût plus élevé pour l’utiliser. Je crois que le pouvoir de fixation des prix est toujours déterminé par notre force technologique et la position de leader que la tendance à long terme nous confère. »

Demande en forte hausse, abandon collectif de la guerre des prix par les grands modèles nationaux

Contrairement à l’année dernière, où la narration de la guerre des prix dominait chez les fabricants de grands modèles nationaux, cette année, ces derniers ont tous commencé à augmenter leurs prix. En mars, Tencent Cloud, Alibaba Cloud et Baidu Intelligent Cloud ont successivement publié des annonces de hausse de prix pour leurs services d’IA et produits liés aux grands modèles. Parmi eux, certains modèles de la série Hunyuan de Tencent Cloud ont augmenté jusqu’à 463,13 %, Alibaba Cloud a augmenté le prix de ses cartes de calcul comme le Zhenwu 810E de 5 à 34 %, et Baidu Cloud a relevé ses prix de services d’IA de 5 à 30 %. Plusieurs grands modèles auparavant en test gratuit ont également cessé leur période de gratuité pour passer à la facturation commerciale.

Cela s’explique en partie par la demande explosive provoquée par la popularité de divers agents intelligents. Selon des sources, le prix des produits d’IA, de stockage et autres d’Alibaba Cloud a augmenté jusqu’à 34 %, principalement en raison de la croissance explosive du volume d’appels Token. « Pendant le Nouvel An chinois, l’application d’agents IA a explosé, et le service MaaS d’Alibaba Cloud a connu une croissance record entre janvier et mars cette année. »

Le modèle MaaS API est une stratégie commerciale courante chez les fabricants de modèles, qui consiste à fournir un service d’appel de modèles via une interface standardisée dans le cloud. Lors d’une conférence téléphonique sur les résultats financiers, le PDG de Zhipu, Zhang Peng, a mentionné que la capacité de l’IA passe désormais d’un usage ludique à la résolution de problèmes de plus en plus complexes et importants, transformant réellement l’appel et la consommation d’API Token en valeur économique. La naissance de nouvelles applications comme “Lobster” et les attentes autour de l’intelligence native au niveau des appareils feront que la consommation d’API et de tokens connaîtra une croissance exponentielle à l’avenir.

Il a également indiqué que, après plusieurs années de développement, l’industrie des grands modèles cherche toujours un modèle commercial simple, économique et puissant pour accélérer la croissance. L’API est un moyen de transformer la capacité infrastructurelle de l’IA en ressources pour le fonctionnement économique.

Lors de la conférence téléphonique sur les résultats de Tencent pour le quatrième trimestre et l’année 2025, la direction a également mentionné que la capacité de production des infrastructures de base comme les CPU est déjà entièrement réservée. Les fournisseurs privilégient généralement les clients de grande taille et avec des commandes stables, tandis que les petites entreprises et les fournisseurs de services cloud ne croient plus pouvoir obtenir un approvisionnement stable, et doivent se tourner vers de très grands fournisseurs de ressources. Ces derniers, opérant avec de faibles marges, doivent augmenter leurs prix lorsque la demande repart à la hausse, car le secteur n’a pas d’autre choix.


Rédaction : Lin Wenqi, journaliste vidéo du Nanfang Dou N.

GLM-4,84%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler