Pénurie de puissance de calcul, les fournisseurs de cloud augmentent collectivement leurs prix

robot
Création du résumé en cours

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

来源:北京商报

La vague de tokens déclenchée par “Lobster” (OpenClaw) met actuellement les fournisseurs de cloud dans une situation embarrassante : plus les utilisateurs en consomment, plus ils perdent de l’argent. Le 18 mars, Alibaba Cloud et Baidu Cloud Intelligent ont décidé de ne plus rester silencieux et ont annoncé qu’à partir du 18 avril, ils augmenteront les prix des capacités de calcul IA, du stockage et des services, avec une hausse maximale de 34 %. En réalité, Tencent Cloud a été le premier à couper ses pertes, ayant déjà augmenté le prix de deux modèles auto-développés une semaine auparavant, avec une hausse maximale de plus de 460 %. Que ce soit en augmentant le “loyer” des cartes de puissance de calcul et des ressources de stockage ou en coupant directement dans les API (interfaces de programmation d’applications) des modèles, combiné à l’entrée dans une période de hausse des prix des puces de stockage à partir du second semestre 2025, les fournisseurs de cloud supportent une pression croissante sur leurs coûts, ce qui entraîne une réaction en chaîne qui ne cesse de s’amplifier. L’agent IA (intelligent agent) transforme les appels API en consommation de puissance de calcul, la puissance étant la base, le token étant la marchandise, et la facture du cloud, déclenchée par “Lobster”, vient frapper à la porte.

Augmentation des prix par deux grands fournisseurs de cloud

Le 18 mars, Alibaba Cloud et Baidu Cloud Intelligent ont annoncé simultanément une hausse des prix. Selon leurs annonces officielles, Alibaba Cloud ajustera les prix des services liés aux cartes de puissance de calcul comme le “PingTouGe ZhenWu 810E” et d’autres, ainsi que du service CPFS (version intelligente), avec une hausse pouvant atteindre 34 %. Baidu Cloud Intelligent a quant à lui précisé que les prix des produits et services liés à la puissance de calcul IA augmenteront d’environ 5 % à 30 %, et ceux du stockage de fichiers parallèles d’environ 30 %. Les deux entreprises attribuent cette hausse à “l’explosion de la demande mondiale en IA”.

Dans cette vague de hausses, Tencent Cloud a été la plus rapide à réagir. Une semaine auparavant, Tencent Cloud avait déjà annoncé une augmentation des prix de deux modèles auto-développés, Tencent HY2.0 Instruct et Tencent HY2.0 Think. Par exemple, pour Tencent HY2.0 Instruct, le prix d’entrée avant la hausse était de 0,0008 yuan pour 1 000 tokens, et après la hausse, il est passé à 0,004505 yuan, soit une augmentation de 463 %. Par ailleurs, Tencent Cloud a mis fin à la période d’essai gratuite de trois modèles (GLM 5, MiniMax 2.5, Kimi 2.5) pour les transformer en services commerciaux payants.

“Cette hausse n’a pas d’impact sur nous”, a déclaré à Beijing Business un responsable technique d’une petite entreprise gérant un site web. “Nous utilisons Baidu Cloud Intelligent, mais nous n’avons pas acheté de capacités de calcul IA ni de stockage de fichiers parallèles.”

Selon leur site officiel, le service de stockage de fichiers parallèles PFS de Baidu Cloud Intelligent est un système de stockage de fichiers parallèles entièrement géré, simple et évolutif, offrant un accès en moins de millisecondes et une haute IOPS (opérations d’entrée/sortie par seconde) pour les scénarios de calcul haute performance. Les cas d’usage incluent la formation et l’inférence en IA, la conduite autonome, le calcul haute performance et le rendu vidéo.

Pour les clients de longue date, ces hausses de prix n’ont pas encore d’impact. Selon l’annonce, les nouveaux tarifs seront appliqués à partir du 18 avril 2026 à 00h00 (heure de Beijing). Les clients ayant déjà acheté des services avant cette date ne verront pas leurs prix actuels modifiés durant leur cycle de facturation en cours, et les nouveaux tarifs s’appliqueront lors de leur prochain renouvellement.

“Nous ne pouvons que répercuter les coûts”

Le même jour où Alibaba Cloud et Baidu Cloud Intelligent ont annoncé leur hausse, Tencent a publié ses résultats financiers du quatrième trimestre et de l’année 2025, où le président-directeur général Ma Huateng a déclaré que Tencent Cloud atteindrait une rentabilité à grande échelle en 2025.

Lors de la conférence téléphonique sur ces résultats, un haut responsable de Tencent a indiqué que la demande en stockage de puces avait fortement augmenté, entraînant une reprise de la besoin en DRAM et en mémoire à haute bande passante (HBM), ainsi qu’en CPU, SSD et HDD. Actuellement, les commandes doivent être réservées plusieurs mois, voire plusieurs trimestres ou années à l’avance. Les fournisseurs privilégient leurs clients les plus importants et stables, comme Tencent Cloud. Les petits fournisseurs de cloud ont désormais du mal à garantir un approvisionnement stable.

Dans ce contexte, le responsable de Tencent estime que l’industrie n’a pas d’autre choix que de répercuter la hausse des coûts sur leurs prix de vente.

Lors d’un échange avec Luo Guozhao, directeur du laboratoire CHIP China, celui-ci a également déclaré à Beijing Business : “La propagation des hausses de prix est inévitable.”

“Les prix de la DRAM, des SSD NAND/HDD et des disques durs HDD ont tous été multipliés par plusieurs fois. Ce sont en fait les principaux postes de dépense pour les équipements de services cloud. Beaucoup pensent à tort que les accélérateurs IA ou GPU (processeurs graphiques) sont coûteux, mais en réalité, leur utilisation est limitée. Par exemple, en utilisant un CPU avec 6 à 8 canaux de mémoire, même avec la configuration la plus petite, cela coûte plus cher qu’un CPU seul, même sans hausse de prix”, a expliqué Luo Guozhao en détaillant la chaîne d’approvisionnement du cloud.

En évoquant la puissance de calcul IA, il a ajouté : “Le déploiement massif de serveurs IA et de centres de puissance de calcul a accentué la pénurie de puces, notamment celles représentées par la mémoire et les SSD. Surtout, ces deux dernières années, la technologie des produits liés à l’IA a été très suivie par le grand public, ce qui a psychologiquement amplifié la demande et entraîné une hausse des prix.”

Du token à la puissance de calcul

La hausse des prix dans la chaîne d’approvisionnement n’est qu’un aspect de la pression sur les coûts des fournisseurs de cloud. La cause apparente réside dans l’explosion de la consommation de tokens provoquée par l’agent IA, avec OpenClaw (surnommé “Lobster”) comme déclencheur.

Contrairement à la conversation IA traditionnelle, où la consommation de tokens par interaction est faible, “Lobster” exécute des tâches de manière autonome, en appelant en continu des outils, chaque étape impliquant une consommation massive de tokens.

“Les prix finiront par devenir de plus en plus bas”, affirme Fu Sheng, président-directeur général de Cheetah Mobile, en évoquant le coût futur de “l’élevage de lobsters”. Il explique : “Les prix sont principalement bloqués par quelques goulots d’étranglement, d’un côté l’électricité, de l’autre les puces, qui nécessitent du temps pour être résolus. En réalité, la structure logicielle peut aussi être optimisée. Pourquoi DeepSeek, lancé l’année dernière (2025), a-t-il connu un tel succès ? Parce qu’il a essentiellement amélioré l’efficacité de l’architecture. En consommant continuellement des tokens, on se rend compte que certains systèmes n’ont pas besoin d’être aussi complexes, ce qui permet de réduire les coûts. En résumé, on peut réduire les prix en agissant sur l’énergie, les puces et les algorithmes.”

Cela contredit la tendance actuelle de hausse des prix chez les fournisseurs de cloud. Luo Guozhao a indiqué à Beijing Business que cette contradiction est en réalité une transformation du modèle commercial, une évolution du marché. “Avant l’apparition de ‘Lobster’, la volonté des utilisateurs individuels de payer pour des tokens était très faible. À cette époque, la consommation était faible, peu volatile, et les utilisateurs pouvaient utiliser gratuitement, ce que les fournisseurs de cloud acceptaient. Mais avec ‘Lobster’ qui consomme des milliards de tokens en continu, cela ne peut plus rester gratuit. Les fournisseurs peuvent alors ajuster leur stratégie tarifaire en fonction de la demande des utilisateurs.”

En réalité, cette hausse des prix a commencé il y a déjà deux mois. Le 22 janvier, AWS a annoncé une augmentation de 15 % du prix de l’EC2 utilisé pour l’entraînement de grands modèles. Le 27 janvier, Google Cloud a annoncé une hausse des prix pour ses services de transfert de données, d’infrastructure IA et de calcul, avec une augmentation maximale de 100 %.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler