La location de GPU Nvidia a augmenté de 48 % en deux mois, une pénurie de puissance de calcul dans l'industrie de l'IA n'a pas été vue depuis cinq ans

robot
Création du résumé en cours

ME News Actualités, le 13 avril (UTC+8), l’industrie de l’IA traverse une crise globale d’approvisionnement en puissance de calcul, avec une flambée des coûts de location de GPU, des pannes fréquentes de services, des suppressions de produits et une perte de clients simultanées. Le prix de location à la demande dans le cloud pour la dernière génération de puces Blackwell de Nvidia a atteint 4,08 dollars de l’heure, contre 2,75 dollars il y a deux mois, soit une hausse de 48 %. Les données proviennent de l’indice des prix de la puissance de calcul publié par le fournisseur de données de tarification GPU Ornn, qui a récemment été intégré à la plateforme Bloomberg Terminal. Le PDG de Vultr, société d’infrastructure cloud, J.J. Kardwell, a déclaré : « C’est la pénurie de puissance de calcul la plus grave que j’aie vue en plus de cinq ans de gestion de cette entreprise. Les cycles de construction des centres de données sont trop longs, et toute l’électricité disponible en 2026 a déjà été réservée. » Anthropic est l’une des entreprises les plus touchées. Le taux de disponibilité opérationnelle de l’API Claude jusqu’au 8 avril sur 90 jours était de 98,95 %, alors que la norme industrielle est de 99,99 %. Le fondateur et PDG de la plateforme de développement logiciel d’entreprise Retool, David Hsu, a déclaré qu’il considérait Opus 4.6 comme le meilleur modèle pour l’entreprise, mais qu’il avait finalement opté pour OpenAI parce que « Anthropic était constamment en panne ». Fin mars, Anthropic a commencé à limiter la consommation de tokens des utilisateurs entre 5h et 11h du matin, heure du Pacifique, en jours ouvrables. La fréquence des pannes est liée à une croissance explosive : le chiffre d’affaires annuel est passé de 9 milliards de dollars fin 2025 à 14 milliards en février, puis à 30 milliards en avril, ce qui aggrave le déficit d’offre. OpenAI fait également des choix. La quantité de tokens API traités est passée de 6 milliards par minute en octobre dernier à 15 milliards fin mars. La directrice financière Sarah Friar a déclaré : « Je passe beaucoup de temps à chercher la dernière puissance de calcul disponible, nous faisons des choix très difficiles, et certains projets ont été abandonnés faute de puissance. » OpenAI a également fermé l’application de génération vidéo Sora, en partie parce qu’il fallait libérer des ressources de puces pour la programmation et les produits d’entreprise. Le fournisseur de services cloud GPU CoreWeave a augmenté ses prix de plus de 20 % fin d’année dernière, en exigeant des contrats d’au moins trois ans pour les petites et moyennes entreprises, contre un an auparavant. Les analystes de Bank of America ont émis la recommandation « Achat » le mois dernier, estimant que la demande excédentaire durerait au moins jusqu’en 2029. (Source : BlockBeats)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler