Pénurie de GPU en reprise : Microsoft et autres fournisseurs de cloud resserrent l'approvisionnement, les startups en IA louant des puces voient leurs prix augmenter de 32 % et doivent faire la queue jusqu'à la fin de l'année

Selon le suivi Beating, plusieurs startups en IA ont rapporté que les fournisseurs de cloud comme Microsoft et Amazon concentrent la puissance de calcul GPU au sein de leurs équipes internes et pour leurs grands clients (OpenAI, Anthropic), tandis que les petits et moyens clients font face à des hausses de prix, de longues attentes et à des conditions contractuelles plus strictes. La direction des ventes de Microsoft Azure a récemment informé ses employés que le délai d’attente pour l’accès aux GPU cloud devrait durer jusqu’à la fin 2026.

Cas précis : la startup d’imagerie générative Krea (financement de $8300 millions, investisseurs incluant Andreessen et Bain Capital Ventures) a loué il y a six mois plusieurs centaines de GPU Blackwell à 2,80 $ par heure par carte, pour un contrat de 6 mois. Lors du renouvellement, plusieurs fournisseurs cloud n’ont pas répondu au téléphone, et l’accord final a été conclu à 3,70 $/heure, soit une hausse de 32 %, avec une prolongation du contrat à un an. Le PDG Victor Perez a déclaré que certains fournisseurs ne répondaient pas directement, d’autres exigeaient un contrat de trois ans pour discuter. Le PDG de Lightning AI, fournisseur de GPU cloud, Will Falcon, a révélé que l’entreprise dispose de 40 000 GPU en ligne, mais que la demande totale de près de 40 clients en attente de 400 000 GPU, avec une hausse des prix de location de plus de 25 % en six mois.

Microsoft applique une gestion hiérarchisée de l’accès aux GPU : environ 1 000 plus grands clients (niveau 1) reçoivent une priorité ; pour les petits clients souhaitant louer des GPU Blackwell, ils doivent s’engager à louer au moins 1 000 unités pour au moins un an, avec un contrat débutant à plusieurs millions de dollars. Les clients payant à l’usage (pay-as-you-go) risquent de voir leur accès révoqué si le GPU reste inutilisé pendant quelques heures. Les startups participant au programme gratuit « Microsoft for Startups » ont également été informées que si elles n’utilisent pas suffisamment leurs GPU, leur accès sera révoqué.

Hemant Taneja, partenaire de General Catalyst, a envoyé un questionnaire aux entreprises dans le portefeuille pour enquêter sur le goulet d’étranglement en capacité de calcul, cette organisation planifiant la mise en place d’un pool de calcul partagé ou d’un groupement d’achat collectif via des sociétés de courtage. Certaines startups commencent à envisager d’acheter leurs propres GPU : la startup d’IA dans le secteur pétrolier Collide prévoit d’acheter directement pour environ $50 millions de GPU Nvidia, louer un espace dans un centre de données et gérer elles-mêmes leur calcul, afin d’éviter les files d’attente et l’incertitude.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler