« Homard » dévore des Tokens à toute vitesse, la facture de la hausse des prix du cloud arrive

robot
Création du résumé en cours

« Lobster » (OpenClaw) a déclenché une vague de hausse des tokens, poussant les fournisseurs de cloud dans une situation embarrassante : plus les utilisateurs en consomment, plus ils perdent gros. Le 18 mars, Alibaba Cloud et Baidu Cloud ont décidé de ne plus rester silencieux et ont annoncé une augmentation des prix des produits et services liés à la puissance de calcul AI et au stockage, avec une hausse maximale de 34 %. En réalité, Tencent Cloud a été le premier à couper ses pertes, en augmentant le prix de deux modèles auto-développés une semaine plus tôt, avec une hausse maximale de plus de 450 %.

Que ce soit en augmentant le « loyer » des cartes de puissance ou des ressources de stockage, ou en ciblant directement l’API (interface de programmation d’applications) des modèles, combiné à l’entrée dans un cycle de hausse des prix des puces de stockage à partir du second semestre 2025, ces trois fournisseurs cloud supportent une pression importante sur leurs coûts, ce qui entraîne une réaction en chaîne. Cependant, toutes les entreprises de cloud ne suivent pas cette tendance ; JD Cloud a publiquement déclaré que ses produits principaux ne seront pas augmentés. D’autres fournisseurs restent pour l’instant inactifs.

Cette hausse des prix n’est pas une coïncidence : plusieurs fournisseurs de cloud étrangers ont déjà augmenté leurs prix en janvier. L’Agent AI (intelligence artificielle) transforme les appels API en consommation de puissance, la puissance étant la base, et le token un produit. La facture du cloud, déclenchée par « Lobster », se présente alors.

Deux grands fournisseurs cloud augmentent collectivement leurs prix

Le 18 mars, Alibaba Cloud et Baidu Cloud ont annoncé la hausse de leurs tarifs le même jour. Selon leurs communiqués officiels, Alibaba Cloud ajustera les prix des services liés aux cartes de puissance comme le Tongtou Ge Zhen Wu 810E, ainsi que ceux de CPFS (version intelligente de calcul), avec une hausse maximale de 34 %. Baidu Cloud a quant à lui indiqué que ses produits liés à la puissance de calcul AI verront leurs prix augmenter d’environ 5 % à 30 %, et ceux de stockage de fichiers parallèles d’environ 30 %. Les deux entreprises attribuent cette hausse à « l’explosion de la demande mondiale en AI ».

Parmi cette vague de hausses, Tencent Cloud a été la plus rapide. Une semaine auparavant, Tencent Cloud avait déjà annoncé une augmentation des prix de deux modèles auto-développés, Tencent HY2.0 Instruct et Tencent HY2.0 Think. Par exemple, pour Tencent HY2.0 Instruct, le prix d’entrée avant la hausse était de 0,0008 yuan pour 1 000 tokens, et après la hausse, il est passé à 0,004505 yuan, soit une augmentation de 463 %. Par ailleurs, Tencent Cloud a mis fin à la période de test gratuite de trois modèles (GLM 5, MiniMax 2.5, Kimi 2.5) pour passer à une offre commerciale payante.

« Cette hausse n’affecte pas notre activité », a déclaré un responsable technique d’une petite entreprise exploitant un site web à Beijing. « Nous utilisons Baidu Cloud, mais nous n’achetons pas de puissance AI ni de stockage de fichiers parallèles. »

Selon leur site officiel, le service de stockage de fichiers parallèles PFS de Baidu Cloud est un système entièrement géré, simple et évolutif, offrant une capacité d’accès en sous-millisecondes et une haute IOPS (opérations d’entrée/sortie par seconde) pour les scénarios de calcul haute performance, d’IA, de conduite autonome, de rendu vidéo, etc.

Pour les clients de longue date, l’impact de cette hausse est limité. Selon l’annonce, les nouveaux prix seront appliqués à partir du 18 avril 2026 à 00h00 (heure de Beijing). Les clients ayant déjà acheté des services avant cette date ne seront pas affectés dans leur cycle de facturation actuel, et les nouveaux tarifs s’appliqueront lors de leur prochain renouvellement.

« Nous n’avons pas d’autre choix, il faut répercuter les coûts »

Le même jour où Alibaba Cloud et Baidu Cloud ont annoncé leur hausse, Tencent a publié ses résultats financiers pour le quatrième trimestre et l’année 2025, avec le président-directeur général Ma Huateng déclarant que Tencent Cloud atteindrait une rentabilité à grande échelle en 2025.

Lors de la conférence téléphonique, un haut responsable de Tencent a indiqué que la hausse des prix des puces de stockage était liée à une demande croissante en IA, ce qui a entraîné une reprise de la demande pour la DRAM et la mémoire à haute bande passante (HBM), ainsi que pour le CPU, les disques SSD et HDD. Les commandes doivent désormais être réservées plusieurs mois, trimestres, voire années à l’avance. Les fournisseurs privilégient les clients les plus importants et stables, comme Tencent Cloud. Les plus petits fournisseurs de cloud ont désormais du mal à garantir une chaîne d’approvisionnement stable.

Dans ce contexte, le responsable de Tencent estime que l’industrie n’a pas d’autre choix que de répercuter la hausse des coûts sur les prix de vente.

Lors d’un échange avec Luo Guozhao, directeur du laboratoire CHIP China, celui-ci a déclaré à Beijing Business : « La hausse des prix est inévitable. »

« La mémoire DRAM, le NAND/SSD, et le HDD ont tous vu leurs prix multipliés par plusieurs fois. Ce sont principalement ces équipements qui constituent les principales dépenses des services cloud. Beaucoup pensent à tort que les accélérateurs AI ou les GPU (processeurs graphiques) sont coûteux, mais en réalité, leur utilisation est limitée. Par exemple, une configuration avec un CPU et 6 à 8 canaux de mémoire, même en configuration minimale, coûte plus cher qu’un CPU seul », explique Luo Guozhao, détaillant la chaîne d’approvisionnement du cloud.

En évoquant la puissance de calcul AI, il précise : « La large déploiement des serveurs AI et des centres de puissance intensifie la pénurie de puces, notamment de mémoire et de SSD. En particulier, ces deux dernières années, les produits liés à l’IA ont suscité un grand intérêt chez le grand public, ce qui a psychologiquement amplifié la demande et entraîné des hausses de prix. »

De Token à puissance de calcul

L’augmentation des coûts dans la chaîne d’approvisionnement n’est qu’un aspect de la pression sur les coûts des fournisseurs cloud. La cause apparente réside dans l’explosion de consommation de tokens provoquée par l’Agent AI, OpenClaw (surnommé « Lobster ») étant le déclencheur.

Contrairement à une conversation AI traditionnelle, où la consommation de tokens est faible, « Lobster » exécute des tâches de façon autonome, en appelant continuellement des outils, chaque étape impliquant une consommation massive de tokens.

« Les prix deviendront forcément plus abordables », affirme Fusheng, président-directeur général de Cheetah Mobile, en évoquant le coût futur de « l’élevage de lobsters ». Il explique : « Les principaux freins actuels sont l’électricité et les puces, qui nécessitent du temps pour être résolus. En réalité, il y a aussi des marges d’optimisation dans la structure logicielle. Pourquoi le DeepSeek lancé l’année dernière (2025) a-t-il connu un tel succès ? Parce qu’il a essentiellement amélioré l’efficacité de l’architecture. Plus on consomme de tokens, plus on se rend compte que certains aspects pourraient être simplifiés, ce qui permettrait de réduire les coûts. En résumé, on peut réduire les prix en agissant sur l’énergie, les puces et les algorithmes. »

Ce qui contredit la tendance actuelle de hausse des prix chez les fournisseurs cloud, Luo Guozhao indique que cette contradiction est en réalité une transformation du modèle économique et une évolution du marché. « Avant l’apparition de ‘Lobster’, les utilisateurs individuels étaient peu enclins à payer pour des tokens. À cette époque, la consommation était faible, peu volatile, et l’utilisation gratuite était acceptable pour les fournisseurs cloud. Mais avec la consommation massive de tokens par ‘Lobster’, cela ne peut plus rester gratuit. Les fournisseurs peuvent alors ajuster leur stratégie tarifaire en fonction de la demande. »

En réalité, cette hausse des prix a commencé il y a deux mois. Le 22 janvier, AWS a annoncé une augmentation de 15 % du tarif pour ses instances EC2 destinées à l’entraînement de grands modèles. Le 27 janvier, Google Cloud a annoncé une hausse des prix pour ses services de transfert de données, d’IA et d’infrastructure de calcul, avec une augmentation maximale de 100 %.

Source : Beijing Business Daily

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler