Quand la commercialisation de la puissance de calcul sera-t-elle prête, et combien de temps faudra-t-il encore avant que le marché à terme des GPU ne soit opérationnel ?

null

Auteur : Caleb Shack, Alana Levin

Traduction : Jiāhuān, ChainCatcher

Chez Variant, nous sommes passionnés par l’exploration de marchés émergents. Les nouvelles classes d’actifs, produits financiers, émissions d’actifs, l’élargissement de l’accès au marché ainsi que de nouvelles façons de participer sont profondément ancrés dans notre ADN fondateur.

Récemment, nous avons réfléchi à un marché autour de la puissance de calcul.

L’acquisition de puissance de calcul est un domaine vaste et en croissance constante, qui semble déjà prêt pour une financiarisation accrue.

Cependant, la dynamique offre-demande de la puissance de calcul est très complexe, opaque et en constante évolution. La question du timing du marché, de sa structure, voire de la nature précise des actifs échangés, reste largement mystérieuse.

Dans le cadre de débats et d’échanges sur ces sujets, nous souhaitons partager un nouveau cadre analytique, comme une fenêtre pour penser le marché de la puissance de calcul.

La naissance d’un nouveau marché à terme nécessite généralement cinq conditions préalables :

Fragmentation de l’offre

Volatilité persistante des prix

Infrastructures de règlement en nature

Unités standardisées et négociables

Absence de substituts pour la découverte des prix ou la couverture

Notre cadre place la configuration actuelle du marché de la puissance de calcul dans ces cinq dimensions. Nous utilisons des analogies historiques pour expliquer l’importance de chaque dimension et prévoir quand le marché pourra atteindre un point critique d’explosion.

Résumé des points clés

Une lecture rapide de ce cadre montre que le marché actuel de la puissance de calcul manque encore de la maturité nécessaire pour soutenir un marché à terme robuste.

(Même si, en dépit de cela, le marché est dynamique, de nombreuses startups s’efforcent activement de changer la donne ; si vous faites partie de ces initiatives, contactez-nous !)

Voici notre évaluation actuelle du marché à terme de la puissance de calcul selon ces cinq dimensions :

Fragmentation de l’offre : 🔴 L’offre est fortement monopolisée par de grands fournisseurs de cloud

Volatilité des prix : 🟢 Les prix des GPU sont extrêmement volatils

Infrastructures de règlement en nature : 🟢 Les courtiers OTC disposent déjà d’infrastructures pour le règlement en nature

Standardisation : 🔴 La puissance de calcul manque d’unités standardisées et négociables

Absence de substituts : 🟡 Les fournisseurs intégrés verticalement peuvent couvrir leurs risques en interne, les autres participants doivent simplement prendre des positions longues

  1. Fragmentation de l’offre (Score : 🔴)

Le marché à terme est un mécanisme de découverte des prix.

En situation de monopole, la découverte des prix n’est plus nécessaire, car les prix sont fixés par quelques grands fournisseurs, éliminant toute incertitude sur la tarification.

Historiquement, cela s’est produit à plusieurs reprises.

Les marchés à terme du pétrole n’ont pu se développer qu’après que le cartel de l’offre (les “Seven Sisters”, sept multinationales qui dominaient le pétrole mondial au milieu du XXe siècle) a vu sa puissance affaiblie.

Le marché de l’électricité s’est formé après la déréglementation, la rupture des monopoles de tarification et l’entrée d’opérateurs indépendants. La fragmentation de l’offre a ainsi favorisé le rôle du marché à terme comme lieu de découverte des prix.

En regardant la dynamique actuelle de la puissance de calcul, l’offre semble plutôt concentrée.

Les quatre géants du cloud (AWS, Azure, GCP, Oracle) contrôlent environ 78 % de la capacité IT critique auto-déployée dans le monde, ainsi qu’environ 69 % de l’approvisionnement en H100 (selon nos calculs, en supposant 12,4 millions de H100 en Q4 2025).

De là, nous déduisons qu’ils dominent également l’offre mondiale de puissance de calcul en termes de durée. L’offre ne semble pas fragmentée.

Pourtant, nous réfléchissons aux facteurs qui pourraient faire évoluer cette dynamique.

De nouveaux fournisseurs de cloud émergent. De nouvelles architectures de puces offrent des opportunités pour d’autres fournisseurs de gagner des parts de marché.

Certaines capacités à long terme de laboratoires majeurs pourraient ne pas être pleinement exploitées, ce qui pourrait faire qu’ils deviennent à terme des fournisseurs ou vendeurs de puissance de calcul sur le marché.

Ainsi, même si la concentration future reste incertaine, notre jugement actuel est que la tendance à la fragmentation de l’offre va probablement s’accentuer.

  1. Volatilité des prix (Score : 🟢)

L’indice Ornn H100 sur le terminal Bloomberg

Un autre préalable pour le marché à terme est que l’actif sous-jacent doit être très volatile.

Sans une volatilité significative, les hedgers n’ont pas d’incitation à se couvrir contre le risque de fluctuation.

La volatilité attire aussi les spéculateurs, qui peuvent tirer profit de mouvements de prix importants. Si le marché est stable ou prévisible, ces acteurs se tourneront vers d’autres marchés.

Ce phénomène a été observé dans le marché pétrolier des années 1950.

À cette époque, en raison d’un excès d’offre, le prix du pétrole soviétique était inférieur à celui des “Seven Sisters”. Ces dernières ont alors réduit leurs prix dans la région sans en informer les producteurs du Moyen-Orient.

Ce choc en chaîne a conduit à la nationalisation du pétrole au Moyen-Orient, à la création de l’OPEP, et à une augmentation de l’incertitude sur les prix mondiaux du pétrole. Par la suite, cette volatilité a alimenté celle du marché électrique dans les années 1970.

La tarification de la puissance de calcul a toujours été, et restera, volatile.

La vitesse à laquelle de nouvelles offres seront mises sur le marché est incertaine. De nouveaux chips ou architectures de centres de données pourraient améliorer l’efficacité en tokens pour certaines tâches. La demande continue de croître, de façon imprévisible.

Nous sommes convaincus que cette condition est désormais remplie.

  1. Infrastructures de règlement en nature (Score : 🟢)

Pour que le marché fonctionne efficacement, les acheteurs doivent être certains de pouvoir recevoir et consommer l’actif sous-jacent à la date et à l’heure convenues.

Cela nécessite des infrastructures : agrégation de l’offre, livraison fiable, règlement des transactions, gestion des collatéraux et des mécanismes de compensation. Ces tâches sont généralement assurées par des intermédiaires ou courtiers.

Dans le marché de l’électricité, ces fonctions sont assurées par des opérateurs de systèmes indépendants, qui jouent le rôle d’entités quasi-gouvernementales et neutres.

Le marché de la puissance de calcul n’a pas encore de rôle parfaitement équivalent, mais notre hypothèse est que : les courtiers ou OTC commencent (et tendent de plus en plus) à assumer ces fonctions.

Aujourd’hui, ces courtiers construisent des indices et des outils d’agrégation de données autour de contrats d’achat et de location de puissance, pour ancrer les prix du marché.

Ornn et Silicon Data ont déjà commencé à publier des prix pour des GPU de niveau datacenter.

Les courtiers s’accordent aussi sur des standards contractuels, à l’image des standards SAFE pour le financement initial. Ces outils complètent l’infrastructure de règlement en nature sous-jacente — qui, auparavant, se limitait souvent à des échanges informels dans des groupes de discussion.

Nous attribuons une note favorable à cette infrastructure, car elle pose la pierre angulaire de la découverte des prix.

Mais elle reste encore loin d’un marché mature comme le PJM ou le WTI. Le volume des transactions est faible, les contrats trop personnalisés, et l’offre trop concentrée pour permettre une compensation à grande échelle.

Il faut voir ce cadre comme un outil de diagnostic, pas comme une conclusion définitive. Il indique ce qui manque, pas ce qui est impossible.

Les énigmes à venir

Le marché évoluera selon des modalités encore incertaines.

Nous avons de nombreuses énigmes non résolues et quelques hypothèses préliminaires. Ces hypothèses sont exploratoires, nécessitant validation ou réfutation. Voici les arguments en faveur des hypothèses les plus solides.

▍Dans 1-2 ans, le marché sera-t-il plus fragmenté ou plus concentré ?

Nous anticipons une fragmentation modérée.

L’émergence de nouveaux fournisseurs de cloud est la plus rapide de toutes.

Avec l’électricité comme contrainte clé, de nouvelles régions s’ouvrent, favorisant ceux qui peuvent établir des capacités à proximité d’énergies bon marché (plutôt que près des grands centres cloud existants).

Les entreprises du Fortune 2000 soutiennent même de petits centres de données. Leur expansion semble inévitable.

Cependant, le modèle commercial standard repose sur de grands contrats à long terme avec des partenaires fiables (grands cloud ou laboratoires de pointe).

Les fournisseurs de cloud comme Hyperbolic ou SF Compute proposent, à l’inverse, des capacités facturées à l’heure.

Ces acteurs servent des startups IA, des applications tournant sur des poids open source, ou des laboratoires de recherche avec des budgets limités, répondant à une demande de puissance de calcul tail.

Nous croyons que l’adoption de poids open source, en particulier, entraînera une fragmentation accrue, car l’offre se “démontélinise” des laboratoires de pointe et des grands cloud.

▍Comment la standardisation va-t-elle évoluer ?

Les fournisseurs d’indices élaborent des standards pour le coût horaire des GPU.

Ces données sont des estimations grossières, pas des prix précis.

Les prix varient selon plusieurs facteurs : région, configuration, durée, rendant la standardisation difficile.

La différenciation des configurations est particulièrement marquée, car les centres de données adaptent leur hardware à des charges spécifiques, et les grands cloud optimisent pour leur écosystème plutôt que pour un marché unifié.

Lorsque la demande du marché devient unifiée, la standardisation apparaît.

Le WTI a été adopté car il sert une large gamme de produits finis (essence, diesel, kérosène).

Aujourd’hui, la demande de puissance de calcul est alimentée par l’IA, pour entraînement et inférence.

L’infrastructure d’entraînement est très spécifique, optimisée pour de longues tâches computationnelles dans des centres concentrés, rendant les instances peu substituables.

L’infrastructure d’inférence, en revanche, doit être plus simple, avec moins de consommation, et optimisée pour la latence, ce qui favorise une distribution géographique plutôt qu’une déploiement en un seul lieu.

L’inférence étant homogène, on prévoit qu’en 2029, plus de 65 % de la demande en puissance IA sera satisfaite par cette infrastructure. On pense que l’optimisation de cette couche d’infrastructure entraînera une convergence des exigences entre fournisseurs.

Si des différences subsistent au niveau des instances chip-level, une autre voie de standardisation pourrait être des benchmarks hardware.

NVIDIA a créé le benchmark MLPerf pour évaluer la performance en inférence et en entraînement de divers modèles.

Dans cette optique, la transaction d’instances GPU ne sera plus basée uniquement sur leurs spécifications hardware, mais aussi sur la qualité et l’efficacité de leur sortie.

▍Quels obstacles à l’émergence de standards dans 1-2 ans ?

Nous pensons que les “walled gardens” et la personnalisation des charges de travail freineront ces efforts.

Dans 1-2 ans, les grands cloud et laboratoires de pointe continueront à maintenir leur domination en matière d’infrastructure IA et de modèles.

S’ils ne se désolidarisent pas, ils continueront à adapter leur hardware à leurs besoins, ce qui compliquera la standardisation, car chaque acteur aura ses propres exigences. La nouvelle architecture des puces fragmentera davantage le hardware, rendant la standardisation plus difficile.

▍Comment les poids open source seront-ils utilisés de façon significative ?

C’est la voie la plus simple pour faire émerger un marché de la puissance de calcul.

Aujourd’hui, deux principaux freins existent : la concentration de l’offre et le manque de standardisation.

L’adoption massive de poids open source démocratise la capacité d’inférence.

Cela motive aussi la création d’opérateurs indépendants, et favorise l’optimisation des infrastructures pour ces modèles spécifiques.

On a vu la même dynamique dans le minage de Bitcoin : le logiciel open source a permis à de nombreux mineurs, et a poussé à la standardisation du hardware.

Jusqu’ici, les poids open source ont été en retard en performance par rapport aux modèles propriétaires.

Mais si cette tendance se poursuit, ils atteindront rapidement le niveau de performance que nous voyons aujourd’hui dans les modèles fermés.

Les entreprises intègrent déjà largement des modèles propriétaires dans leurs systèmes, constatant une augmentation significative de productivité. En trois mois, un modèle aussi performant pourrait coûter une fraction de ce qu’il coûte aujourd’hui.

Cependant, la majorité des entreprises continueront probablement à privilégier les modèles les plus performants.

Nous pensons qu’un jour, les modèles propriétaires de pointe deviendront trop coûteux pour leur tâche, et les entreprises optimiseront leur allocation intelligente entre différents modèles.

Il faut garder à l’esprit que, pour l’instant, les laboratoires de pointe offrent des services d’inférence à perte, et doivent augmenter leurs prix pour continuer à fonctionner. À ce moment-là, les poids open source auront leur heure de gloire.

▍Quelle sera la unité de tarification des transactions finales ?

La puissance de calcul peut être décomposée en trois couches : puce, heure d’instance de puce, Token.

Au niveau de la puce — l’offre est très concentrée.

ASML monopolise les machines de lithographie utilisées par TSMC, TSMC contrôle les fabricants de puces pour NVIDIA, et NVIDIA domine la conception des puces de pointe.

De plus, une puce n’est utile que si elle est alimentée en énergie et reste en ligne longtemps. Nous pensons donc qu’une seule puce livrable ne sera pas la unité de tarification finale.

Au niveau de l’heure d’instance de puce — cela désigne la période durant laquelle la puce est réellement utilisée.

C’est probablement l’état le plus précieux d’une puce, et le cœur de notre discussion.

Dans cette couche, tant qu’il existe une demande suffisante pour la puissance de calcul, celle-ci se comportera comme un produit, à l’image de l’électricité.

Nous imaginons que la puissance de calcul sera échangée comme une ressource de service public : standardisation par contrat régional (la puissance comme une fonction de l’électricité), avec en plus un marché spot et des marchés à terme pour la couverture. Sous cette forme, cela est réalisable.

Au niveau du Token — il s’agit du produit en aval de l’instance de puissance, qui pourrait aussi devenir l’unité de tarification finale.

Si le Token devient le principal moteur de l’instance, le marché du Token offrira une couverture pour la demande, et la partie offre pourra verrouiller ses revenus.

L’offre pourra couvrir ses coûts via des contrats à long terme ou une intégration verticale, en maintenant une certaine concentration.

Cependant, le Token n’est pas uniforme entre modèles. Chaque modèle a ses propres standards de découpage, et produit des sorties différentes, rendant leur interchangeabilité limitée entre cas d’usage.

Mais nous suivons de près l’évolution dans ce domaine.

BTC-1,76%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé