Les coûts de puissance de calcul de l'IA augmentent constamment, les prix des GPU "comme le pétrole" fluctuent avec l'offre et la demande.

robot
Création du résumé en cours

Les coûts d'infrastructure IA connaissent des fluctuations violentes, et l'imprévisibilité des prix des serveurs GPU est devenue un défi central pour les fournisseurs de services cloud et les développeurs d'IA.

Selon The Information, sous l'effet de la pénurie de puces mémoire et d'autres composants clés, les prix des serveurs IA de Nvidia n'ont cessé d'augmenter ces derniers mois, certains composants variant jusqu'à 40 % en l'espace d'une seule semaine. Cette situation a poussé plusieurs fournisseurs de services cloud à relever successivement leurs tarifs de location destinés aux développeurs d'IA — le fournisseur de services GPU Nebius a augmenté d'environ 30 % le prix de la location de capacité de calcul à la demande le 1er juin, et Amazon AWS a ensuite annoncé une hausse d'environ 20 % des prix de ses blocs de capacité EC2 à partir du 1er juillet.

Ces fluctuations brutales remodèlent la structure de coûts de l'ensemble du marché de la puissance de calcul IA. Selon Carmen Li, PDG du fournisseur de données de prix Silicon Data, les prix de location des GPU facturés par les fournisseurs de services cloud à leurs clients présentent désormais des caractéristiques d'offre et de demande similaires à celles des marchés de matières premières comme le pétrole. Les clients de taille moyenne et petite qui louent de la capacité de calcul à la demande sont les premiers touchés, et l'opacité du mécanisme de fixation des prix aggrave encore le désavantage informationnel des acheteurs.

Fluctuation brutale des coûts des composants, fenêtre de fixation des prix des serveurs extrêmement réduite

L'instabilité des prix des serveurs GPU trouve sa source dans la tension extrême de la chaîne d'approvisionnement en amont.

Selon une personne qui vend des serveurs Nvidia à des fournisseurs de services cloud, le coût des composants nécessaires aux racks de serveurs peut fluctuer jusqu'à 40 % en une seule semaine, impliquant les wafers d'entrée produits par TSMC, le co-packaging, le réseau, le refroidissement, et surtout les composants mémoire. Cette personne déclare que les prix des racks de serveurs GPU « fluctuent de manière très violente », que « tout peut changer complètement en deux ou trois semaines, il est impossible de prévoir la tendance des prix, on ne peut les verrouiller que dans une fenêtre très courte », rendant impossible toute planification des coûts sur une plus longue période.

Un dirigeant d'un fournisseur de services cloud GPU indique que les racks de serveurs qu'il achète augmentent récemment d'environ 2 à 3 % par semaine. Un dirigeant d'un concurrent souligne que les disques de stockage NVMe dans les racks Grace Blackwell 300 de Nvidia sont la principale source de fluctuation des prix, la volatilité ayant été « très violente » il y a quelques mois, et que le coût actuel du rack est supérieur de 10 à 15 % à son « prix de référence ». La tendance à la hausse des prix du rack GB300 semble actuellement se stabiliser, avec une augmentation mensuelle d'environ 1 %.

L'impact des fluctuations est considérablement amplifié par l'ampleur absolue des montants. Un seul rack équipé de systèmes de puces Grace Blackwell 300 coûte 70 000 dollars par système, et un rack complet de 72 systèmes coûte environ 5 millions de dollars, certains clients achetant des milliers de racks à la fois. Selon un cadre client qui achète des racks Vera Rubin, le prix estimé de ce modèle est d'environ 7 millions de dollars.

Le pouvoir de fixation des prix se transmet le long de la chaîne d'approvisionnement, Nvidia et les fabricants de mémoire dominent

Derrière cette augmentation des coûts se trouve une forte concentration du pouvoir de fixation des prix à chaque maillon de la chaîne d'approvisionnement.

La personne qui vend des serveurs affirme que Nvidia « peut exiger pratiquement n'importe quel prix ». Un porte-parole de Nvidia répond que le prix dépend du coût des composants du rack de serveurs, que l'entreprise fixe les prix en collaboration avec les fournisseurs de serveurs, et que des différences peuvent exister entre les fournisseurs. Les données montrent que la marge brute de Nvidia a augmenté de 15 à 20 points de pourcentage au cours des dernières années, confirmant son fort pouvoir de fixation des prix sur le marché.

Parallèlement, les fabricants de puces mémoire, à l'image de Micron, exercent une pression similaire sur les prix envers Nvidia et d'autres clients, entraînant une hausse des prix de tous les produits, des Mac d'Apple aux GPU de Nvidia.

Carmen Li souligne qu'une fois que les puces quittent Nvidia, les prix de location pratiqués par les fournisseurs de services cloud commencent à suivre la logique d'offre et de demande des marchés de matières premières. Selon ses données, le prix de location des puces Blackwell 200 a augmenté d'environ 20 % depuis le début de l'année ; celui des puces Nvidia plus anciennes, après une hausse cumulée de plus de 20 % au cours de l'année écoulée, s'est globalement stabilisé au cours des 30 derniers jours.

Les clients de taille moyenne et petite subissent la plus forte pression, l'opacité du marché en matière de transparence des prix est structurelle

Dans cette flambée des prix, les clients qui louent de la capacité de calcul à la demande se trouvent dans la position la plus vulnérable.

Les fournisseurs de services cloud testent actuellement la limite supérieure des prix dans un contexte de pénurie de GPU, ou bien orientent les ressources des serveurs vers les grands clients, réduisant ainsi la puissance de calcul disponible pour les clients de taille moyenne et petite. Cependant, la tendance des prix n'est pas unidirectionnelle. Un dirigeant d'un développeur de modèles d'IA indique qu'après avoir doublé au cours des un à deux mois précédents, les prix ont en réalité baissé ces deux dernières semaines. Cette divergence reflète le fait que le marché des services cloud GPU en est encore à un stade relativement précoce, et que le nombre de fournisseurs de services cloud GPU a explosé, le paysage du marché n'étant pas encore figé.

L'absence de transparence des prix aggrave encore l'incertitude des acheteurs. Les fournisseurs de services cloud GPU ne divulguent généralement pas leurs prix réels, ce qui fait que le pouvoir de fixation des prix est en réalité entre les mains des fournisseurs, et non des clients.

Un investisseur d'un fournisseur de services cloud GPU exprime ses inquiétudes à ce sujet : « Pour nos clients principaux, il existe un point de bascule — une fois que l'équation économique ne tient plus, leur activité devient intenable, et nous ne voulons absolument pas franchir cette ligne rouge. » Cette déclaration révèle que la hausse continue des coûts de la puissance de calcul finira par constituer une contrainte substantielle sur la viabilité commerciale de la couche applicative de l'IA.

Avertissement sur les risques et clause de non-responsabilité

        Le marché comporte des risques, investissez avec prudence. Cet article ne constitue pas un conseil d'investissement personnel et ne tient pas compte des objectifs d'investissement, de la situation financière ou des besoins spécifiques de certains utilisateurs. Les utilisateurs doivent considérer si les opinions, points de vue ou conclusions contenus dans cet article correspondent à leur situation particulière. Tout investissement effectué sur cette base relève de la seule responsabilité de l'investisseur.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé