La pénurie de GPU réapparaît : les fournisseurs de cloud resserrent l'approvisionnement, les startups en IA font face à une augmentation de 32 % du prix de location des puces et à de longues attentes jusqu'à la fin de l'année

Selon la surveillance de Beating, plusieurs startups en IA ont rapporté que les fournisseurs de cloud comme Microsoft et Amazon concentrent la puissance de calcul GPU vers leurs équipes internes et leurs principaux clients (tels qu’OpenAI et Anthropic), laissant les petits et moyens clients faire face à des augmentations de prix, de longs délais d’attente et des conditions contractuelles plus strictes. Récemment, la gestion des ventes d’Azure chez Microsoft a informé les employés que le délai d’attente pour les GPU des clients cloud devrait durer jusqu’à la fin 2026. Un cas spécifique concerne la startup de génération d’images Krea (qui a levé $83 millions, avec des investisseurs tels qu’Andreessen et Bain Capital Ventures), qui a loué des centaines de cartes Blackwell pour 2,80 $ par carte par heure il y a six mois dans le cadre d’un contrat de six mois. Lorsqu’il a été temps de renouveler, plusieurs fournisseurs de cloud n’ont pas répondu aux appels, et l’accord final a été conclu à 3,70 $/heure, une augmentation de 32 %, le contrat étant prolongé à un an. Le PDG Victor Perez a déclaré que certains fournisseurs n’ont pas répondu du tout, tandis que d’autres n’ont engagé de discussions que pour des contrats de trois ans. Will Falcon, PDG du fournisseur de cloud GPU Lightning AI, a révélé que l’entreprise dispose de 40 000 GPU en ligne, mais que la demande totale d’environ 40 clients en file d’attente atteint 400 000 GPU, avec des prix de location en hausse de plus de 25 % en six mois. Microsoft applique une gestion hiérarchisée pour l’accès aux GPU : environ 1 000 plus grands clients (Tier 1) sont prioritaires ; les petits clients souhaitant louer des cartes Blackwell doivent s’engager pour au moins 1 000 unités pour une durée minimale d’un an, avec des contrats débutant à des dizaines de millions de dollars. Les clients payant à l’usage peuvent voir leur accès révoqué par Microsoft si leurs GPU restent inactifs pendant plusieurs heures. Les startups participant au programme de quota gratuit ‘Microsoft for Startups’ ont également été informées que l’insuffisance d’utilisation entraînera le retrait de l’accès aux GPU. Hemant Taneja, partenaire de General Catalyst, a interrogé les entreprises de leur portefeuille sur les goulots d’étranglement en puissance de calcul, et la société prévoit de créer une piscine de calcul partagée ou une négociation collective pour les entreprises investies. Certaines startups commencent à envisager l’achat direct de GPU : la startup IA Collide dans l’industrie pétrolière prévoit de dépenser environ 500 000 dollars pour acheter directement des GPU NVIDIA et louer de l’espace dans un centre de données pour fonctionner de manière indépendante, afin d’éviter les files d’attente et les incertitudes.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler