Meta vend de la puissance de calcul, Palantir insulte dans la rue, Zhipu devient le top de la Silicon Valley, l'histoire des Capex en IA doit changer de narration.

Écrit par : Beatz Sound

Le marché de l'IA corrige violemment à nouveau, cette fois parce que Meta a dit qu'il pourrait vendre sa puissance de calcul excédentaire.

Si cette nouvelle était tombée il y a trois ans, personne ne l'aurait trouvée étrange. Le cloud computing est fondamentalement un business qui consiste à découper des serveurs en morceaux pour les revendre. Amazon, Microsoft et Google le font depuis des années. CoreWeave, Nebius et d'autres nouveaux fournisseurs de cloud suivent aussi cette voie, en transformant les puces Nvidia en garanties de financement, puis le financement en plus de puces.

Mais quand c'est Meta, les choses prennent une autre tournure.

Par le passé, Meta ne voyait pas la puissance de calcul de cette façon. Il achetait des puces, construisait des centres de données, accaparait l'électricité et les terrains pour ses propres modèles, pour son système publicitaire, pour ses flux de recommandation, pour cette superintelligence que Zuckerberg annonce comme de plus en plus proche. Ce n'est pas un fournisseur de cloud. Il ne gagnait pas d'argent en louant ses machines aux autres.

Une entreprise disait autrefois : j'ai besoin d'autant de machines que possible, car l'avenir les consommera toutes. Aujourd'hui elle dit : si ces machines ne sont pas toutes utilisées pour le moment, on peut aussi les vendre à d'autres.

Cela ne prouve pas directement une surcapacité de calcul, mais on ne peut pas non plus l'ignorer.

Le jour du krach boursier, Alex Karp, PDG de Palantir, a déversé sa colère pendant près de vingt minutes devant la caméra sur CNBC.

Il était venu pour parler du nouveau partenariat entre Palantir et Nvidia, mais le sujet a rapidement dévié vers le modèle de tarification des tokens d'OpenAI et d'Anthropic. Il a dit que des PDG se plaignent en privé : l'adoption de l'IA en entreprise revient à « payer pour des tokens qui ne créent aucune valeur, tout en livrant ses données ». Il a même qualifié les factures de modèles de plus en plus chères d'impôt sur la fortune pesant sur les entreprises.

Ces deux dernières années, on ne parlait que de qui ose dépenser, qui dépense vite, qui peut empiler des centres de données en premier. Maintenant la question change peu à peu. Une fois les machines achetées, qui peut les faire tourner à plein régime en permanence ?

La déclaration de Meta n'est pas encore devenue une activité officielle. Dans les rapports publics, il existe une direction interne appelée Meta Compute, qui pourrait vendre de la puissance de calcul brute, ou, comme Amazon Bedrock, mettre différents modèles sur son infrastructure et les vendre aux développeurs. Zuckerberg avait déjà mentionné lors d'une réunion d'actionnaires que des entreprises externes viennent presque chaque semaine demander s'ils peuvent acheter leur service API, ou une partie de leur compute, et qu'elles sont prêtes à payer un prix supérieur au coût de Meta.

Il avait alors ajouté une phrase. Ils ne le font pas encore, car Meta estime avoir encore besoin de cette puissance de calcul.

Si on en a besoin, la location est une option. Si on n'en a plus besoin, la location devient un antidouleur pour le bilan.

C'est là que le jugement est le plus difficile. Meta pourrait simplement libérer une fenêtre dans son rythme de construction, en vendant temporairement les ressources inutilisées. Il pourrait aussi indiquer aux investisseurs que les dépenses d'IA à des centaines de milliards de dollars ne peuvent pas être soutenues indéfiniment par une lointaine superintelligence ; il faut d'abord trouver une ligne de revenus plus proche.

Ces deux interprétations sont possibles.

La demande n'a pas disparu, elle commence juste à trier

Les Capex sont le cœur du récit de l'IA, sans exception. Comme l'assouplissement monétaire de 2021, les Capex sont censés croître en permanence, l'argent coule à flots, et toutes les branches que le marché spécule montent ensemble. Dès que Meta annonce qu'il prépare la vente de sa puissance de calcul, beaucoup réagissent : les capex de l'IA vont s'effondrer. Les grandes entreprises admettent enfin qu'elles ont trop acheté, la fête des semi-conducteurs est finie.

Dire cela est trop simpliste.

Les données publiques ne soutiennent pas encore une conclusion aussi nette. Les revenus d'AWS au premier trimestre ont augmenté de 28% pour atteindre 37,6 milliards de dollars, une croissance rare ces dernières années. Google Cloud a connu une croissance encore plus forte au premier trimestre, avec des revenus atteignant 20 milliards de dollars. Microsoft Azure tourne toujours autour de 40% de croissance.

Amazon a déclaré que ses dépenses d'investissement pourraient atteindre 200 milliards de dollars cette année. Alphabet a relevé ses prévisions de dépenses d'investissement pour 2026 à 180-190 milliards de dollars. Meta a aussi relevé ses dépenses d'investissement annuelles à 125-145 milliards de dollars.

Ces chiffres ne ressemblent pas à un effondrement de la demande.

Ils ressemblent plutôt à une redistribution.

La situation des fournisseurs de cloud est différente de celle des fournisseurs de modèles. Les fournisseurs de cloud vendent la route. Tant qu'il y a du trafic, quel que soit le constructeur du véhicule, ils peuvent encaisser. OpenAI, Anthropic, les clients entreprises, les clients gouvernementaux, les startups, finissent tous par atterrir dans un centre de données, une certaine puce, un réseau, un contrat d'électricité.

C'est pourquoi les trois grands clouds peuvent continuer à être durs.

AWS a même augmenté le prix d'un service d'IA cloud fin juin : un service de réservation anticipée de GPU. AWS a augmenté ce service d'environ 20% à partir de juillet. En janvier, il l'avait déjà augmenté d'environ 15%. Ce n'est pas une action que l'on voit quand la demande est faible.

En période de pénurie, le vendeur augmente ses prix.

Mais les entreprises de modèles ne peuvent pas toutes se permettre un tel confort.

Les actifs des entreprises de modèles sont plus exigeants. La puissance de calcul ne génère pas de revenus simplement en étant là. Elle doit être constamment remplie par des modèles plus intelligents, des utilisateurs plus fréquents, des workflows d'entreprise plus chers. Ce n'est que lorsque le modèle est suffisamment bon que les utilisateurs acceptent de supporter les files d'attente, les limites, les hausses de prix et les niveaux d'abonnement de plus en plus complexes.

C'est aussi pourquoi Anthropic est perçu par le marché comme un autre type d'entreprise. Pas parce qu'il est bon marché, mais parce que les utilisateurs sont prêts à lui confier des tâches coûteuses. Écrire du code, modifier des systèmes, exécuter de longues tâches, intégrer des workflows d'entreprise : quand ces tâches entrent vraiment en production, la consommation de tokens est bien plus élevée que lors de simples discussions.

Le problème d'un modèle fort, c'est le manque de machines.

Le problème d'un modèle faible, c'est que personne ne se soucie de ses machines.

Ces deux problèmes s'appellent puissance de calcul, mais ce ne sont pas la même chose.

La ligne xAI a aussi la même saveur. Grok n'a pas formé une mentalité d'entreprise claire comme le meilleur modèle, mais une partie de la puissance de calcul du système Musk peut être dirigée vers Anthropic. Ce geste est plus froid que n'importe quel slogan. Les machines ne connaissent pas le fondateur, elles ne connaissent que celui qui peut les faire tourner à plein régime.

La relation entre Google et Meta montre aussi que les choses ne sont pas si simples. En juin, il a été rapporté que Google avait limité l'utilisation de Gemini par Meta, parce que la puissance de calcul que Meta voulait acheter dépassait ce que Google pouvait fournir, affectant même certains projets d'IA internes de Meta. Une entreprise envisage de vendre de la puissance de calcul tout en ne pouvant pas acheter suffisamment de capacité de modèle de pointe pour certaines tâches.

Ce n'est pas une surcapacité au sens traditionnel.

C'est un déséquilibre. Parce que les factures commencent à devenir criardes.

Les fournisseurs de cloud peuvent continuer à augmenter leurs prix car ils vendent de la certitude. Le client veut un GPU qu'il peut obtenir à coup sûr pendant une période donnée, un centre de données stable, une infrastructure qui ne tombe pas en panne en pleine nuit.

Mais une fois que les clients entreprises obtiennent la puissance de calcul, le problème n'est pas résolu.

Ils doivent encore présenter cette facture au CFO. Le CFO ne demande pas combien de tokens vous avez utilisés, il demande combien d'argent ces tokens ont économisé à l'entreprise, combien de bénéfices supplémentaires ils ont apportés, combien d'erreurs ils ont évitées.

Chez l'entreprise, le token devient un compteur électrique

Cela nous ramène à l'interview de Karp au début.

Il qualifie de survente ce que beaucoup de sociétés d'IA vendent aux entreprises. La veille de l'émission, Palantir avait publié une déclaration en neuf points sur X, parlant de la souveraineté de l'IA, en pointant spécifiquement le modèle « tokenmaxxing ». Ce terme est difficile à traduire, littéralement ça sonne mal, mais le sens n'est pas compliqué : considérer la consommation de tokens comme un progrès, brûler de l'argent comme une utilisation, et la facture comme une productivité.

Karp a mis en lumière les laboratoires de pointe comme OpenAI et Anthropic. Son propos n'est pas que les entreprises ne devraient pas utiliser les meilleurs modèles, mais qu'elles ne devraient pas livrer leurs données, processus et jugements métier, puis payer une facture de plus en plus élevée basée sur la consommation.

Palantir veut vendre autre chose. Pas une boîte de dialogue générique, pas une seule API, mais un système qui intègre les données, les approbations, les autorisations, les règles opérationnelles et l'IA dans le même système métier. Ce que le client paie, ce n'est pas « le nombre d'utilisations de l'IA », mais si une ligne de production, un processus de gestion des risques, une mission gouvernementale a réellement été transformée.

Ceux qui gèrent vraiment l'argent dans les entreprises commencent à se réveiller.

UBS a récemment discuté avec des responsables IT d'entreprises, et une direction est claire. Beaucoup d'entreprises n'arrêtent pas d'utiliser l'IA, mais elles commencent à freiner les dépenses liées à l'IA. Environ 60% des entreprises interrogées réduisent leurs dépenses en tokens et ajoutent des garde-fous, surtout celles qui ont dépassé la phase d'essai et commencent à intégrer l'IA dans leurs processus quotidiens.

C'est aussi un renversement très intéressant.

Une fois que l'IA passe du jouet à l'outil, dépenser devient plus difficile. Dans la phase jouet, le patron donnait son budget car tout le monde avait peur de rater quelque chose. Dans la phase outil, le CFO demande à qui cela fait gagner du temps, à qui cela vend plus de produits, à qui cela réduit les risques.

Sur ce tableau, le token ne ressemble pas à un revenu.

Il ressemble plutôt à un compteur électrique.

On peut bien sûr dire qu'un compteur qui tourne vite signifie que l'usine tourne. On peut aussi dire qu'un compteur qui tourne trop vite sans augmentation de production signifie que la machine a un problème.

Les agents d'IA amplifient ce problème. Une étude Codex d'OpenAI et de plusieurs universités contient des données effrayantes. Au premier semestre 2026, le nombre d'utilisateurs actifs de Codex a été multiplié par plus de cinq ; les tokens de sortie de certains postes chez OpenAI ont également explosé – le nombre médian de tokens de sortie mensuels pour les postes juridiques était 13 fois plus élevé qu'en novembre 2025, et pour les postes de recherche, plus de 50 fois.

Une autre étude va encore plus loin. Les tâches de codage agentique peuvent consommer jusqu'à 1000 fois plus de tokens que les discussions de code normales et le raisonnement de code. Pour une même tâche, la consommation de tokens entre différentes exécutions peut varier de 30 fois.

C'est là le véritable fondement de la pénurie de calcul aujourd'hui.

Ce n'est pas que les gens posent quelques questions supplémentaires à un chatbot.

C'est que les logiciels commencent à devenir des petits ouvriers qui lisent des fichiers, exécutent des commandes, modifient du code, échouent, recommencent, échouent encore, recommencent encore. Ils n'ont pas de pause déjeuner, mais chaque étape consomme des tokens.

Quand le token devient un compteur électrique, celui qui possède la centrale électrique a le pouvoir. Mais celui qui gaspille l'électricité sera aussi le premier à être interrogé.

Quand la facture devient plus épaisse, les modèles bon marché trouvent leur place

Une fois que le CFO commence à regarder ce compteur, la prochaine étape est presque évidente.

Il demandera quelles tâches nécessitent les meilleurs modèles, et quelles tâches se contentent de modèles suffisants.

À ce moment-là, GLM, Kimi, DeepSeek, Qwen et autres modèles open source ne sont plus seulement des nouvelles technologiques. Ils deviennent des outils de négociation sur la table des achats des entreprises.

Même Marc Andreessen, le célèbre VC de la Silicon Valley chez a16z, a déclaré que de nombreux professionnels de l'IA considèrent déjà le GLM-5.2 de Zhipu comme l'un des premiers modèles chinois capables d'égaler, voire de surpasser, les meilleurs modèles américains ouverts dans la plupart des tâches. Ce jugement n'est peut-être pas le verdict final, mais il donne aux entreprises une option supplémentaire.

Coinbase a donné un exemple plus concret. Brian Armstrong a dit que l'entreprise a remplacé son modèle d'IA par défaut par des modèles open source comme GLM 5.2 et Kimi 2.7, combinés avec du routage de modèles, du cache et une réduction du contexte. L'utilisation de tokens continue de croître de façon exponentielle, mais les dépenses d'IA ont été réduites de près de moitié.

La puissance de cette déclaration réside dans le fait que, pour la première fois, les entreprises peuvent acheter les capacités des modèles de manière séparée.

Les tâches les plus difficiles continuent d'être confiées aux modèles les plus chers. Les résumés ordinaires, le service client, l'extraction d'informations, le code modélisé, les FAQ internes sont confiés à des modèles bon marché et à des déploiements locaux.

Les modèles open source n'ont pas besoin de gagner tous les combats.

Ils doivent seulement faire croire au service achats que chaque kilowattheure n'a pas besoin d'être payé au tarif d'une villa de luxe.

À ce stade, la vente de puissance de calcul par Meta n'est plus une nouvelle isolée.

Elle raconte la même chose que Palantir critiquant les tokens et Coinbase coupant dans les modèles open source : la chaîne de dépenses de l'IA commence à être décomposée. En amont, on vend de la certitude, au milieu on vend des résultats, en aval on fait baisser les prix unitaires. Chaque couche continue de croître, mais chaque couche commence à être interrogée : cet argent a-t-il été bien dépensé ?

Le plus difficile n'est pas d'acheter des machines, c'est de les faire fonctionner en continu

Ces deux dernières années, l'histoire la plus facile à raconter dans l'industrie de l'IA était le manque de ressources.

Pas assez de GPU, pas assez d'électricité, pas assez de centres de données, pas assez d'ingénieurs, pas assez de cloud pour faire tourner les modèles. Cette histoire était trop fluide. Quand il y a pénurie, tout le monde se précipite instinctivement. D'abord occuper la place, signer des contrats d'électricité, acheter des puces, monter les machines.

Quand on se bat pour les ressources, on ne fait pas trop de calculs précis.

Parce que le coût d'être en retard semble plus grand.

Mais la nouvelle de Meta a mis en lumière un autre problème. Une fois les machines achetées, ce n'est pas parce qu'elles sont chères qu'elles deviennent automatiquement une bonne affaire. Il faut qu'elles aient du travail chaque jour, des clients prêts à payer, des modèles pour les faire tourner à plein régime, des applications pour transformer les coûts en revenus.

C'est ce qu'on appelle le taux d'utilisation.

Le mot taux d'utilisation semble froid, mais en réalité il est impitoyable. Il ne demande pas si vous avez un avenir, il demande si votre machine a fonctionné aujourd'hui. Il ne se soucie pas de ce que vous dites lors de vos conférences de presse, ni si vous avez acheté le GPU le plus cher. Il ne regarde qu'une seule chose : cet argent s'est-il transformé en flux de trésorerie durable ?

Les fournisseurs de cloud répondent plus facilement à cette question. Ils vendent des infrastructures depuis toujours. AWS, Google Cloud, Azure vendent des routes, de l'électricité et des salles de machines. Les clients qui veulent entraîner des modèles, faire de l'inférence, héberger des applications, finissent tous par atterrir dans un cloud.

C'est pourquoi ils peuvent rester durs.

Les entreprises de modèles forts ont aussi leur propre réponse. Si le modèle est suffisamment fort, les utilisateurs acceptent de faire la queue, les entreprises de s'intégrer, les développeurs de modifier leurs workflows autour de lui. Dans ce cas, la puissance de calcul n'est pas un stock, c'est un goulot d'étranglement. Plus il y a de machines, plus on peut en tirer parti.

Le plus difficile, c'est la couche intermédiaire.

Elles ont des machines, des histoires, des équipes de modèles, et de gros budgets. Mais le modèle n'est pas en tête, le produit n'est pas devenu une habitude quotidienne, et les développeurs ne sont pas prêts à modifier leurs workflows pour lui. Pour ce type d'entreprise, la puissance de calcul passe d'arme à stock en une seule fois, après un échec de lancement de modèle ou une migration d'utilisateurs.

Le stock n'est pas inutile.

Mais le stock doit être baissé, loué, trouver de nouvelles utilisations.

C'est ce qui rend la vente de puissance de calcul par Meta si frappante. Cela ne prouve pas l'échec de Meta, ni la disparition de la demande d'IA. Cela permet simplement au marché de voir pour la première fois que les infrastructures d'IA peuvent aussi rencontrer les mêmes problèmes qu'une usine ordinaire.

L'usine est construite, où sont les commandes ?

La puissance de calcul n'a pas disparu, elle commence juste à se stratifier

Donc la meilleure façon de comprendre cela n'est pas la « surcapacité de calcul ».

Ce terme est trop grossier.

Une formulation plus précise serait : la puissance de calcul commence à se stratifier.

La couche supérieure reste tendue. Les meilleurs modèles, les meilleurs clouds, les clusters de GPU les plus stables sont toujours disputés. AWS peut augmenter ses prix parce que la certitude a un prix. Le client n'achète pas seulement un GPU, il achète la garantie qu'à un jour, à une heure donnée, un certain lot de machines sera disponible.

La couche intermédiaire devient gênante. Elle n'est peut-être pas mauvaise, mais elle n'est pas rare. Elle peut faire tourner des modèles, faire de l'inférence, et être vendue à des clients externes. Mais le client va comparer, négocier, demander pourquoi ne pas utiliser un modèle moins cher, pourquoi ne pas utiliser le cloud d'un autre, pourquoi ce lot de machines vaut ce prix.

La couche inférieure sera progressivement écrasée par les modèles open source et l'optimisation des coûts. Les entreprises n'appelleront pas toujours le modèle le plus cher pour des tâches ordinaires. Elles feront du routage, du cache, réduiront le contexte, et diviseront les modèles en différents niveaux.

La demande a grandi.

Un enfant ne regarde pas la facture, un adulte le fait. Quand l'IA entre dans l'entreprise, elle vit aussi ce processus. En phase pilote, tout le monde a peur de rater ; en phase de passage à l'échelle, tout le monde commence à faire les comptes.

Une fois les comptes faits, la chaîne industrielle ne sera plus aussi homogène qu'au début.

Certains continueront d'augmenter leurs prix, parce qu'ils vendent une certitude irremplaçable. D'autres se mettront à vendre des résultats, parce que les clients ne veulent pas payer pour la consommation elle-même. D'autres seront contraints de baisser leurs prix, parce que des alternatives suffisantes sont apparues. D'autres loueront leurs machines, parce que les machines inactives sont plus laides que louées à bas prix.

Ces choses se produisent en même temps, ce qui donne l'impression que l'industrie est contradictoire.

D'un côté, la puissance de calcul est rare.

De l'autre, on loue de la puissance de calcul.

D'un côté, la consommation de tokens explose.

De l'autre, les entreprises réduisent leurs dépenses d'IA.

D'un côté, les modèles de pointe deviennent de plus en plus forts.

De l'autre, les modèles open source deviennent de moins en moins chers.

Ils ne sont pas en conflit. Ils montrent simplement que l'IA est passée d'une histoire de volume à une histoire de structure.

L'histoire du vieux chemin de fer se répétera

Pendant la bulle ferroviaire du 19e siècle, les chemins de fer n'étaient pas faux.

Les rails posés, les marchandises circulaient vraiment, les villes grandissaient vraiment, le temps était vraiment raccourci. Beaucoup des réseaux commerciaux les plus précieux par la suite se sont développés le long de ces rails.

Mais cela n'a pas empêché beaucoup de constructeurs de chemins de fer de perdre de l'argent à l'époque.

Ils n'ont pas perdu sur la direction. Ils ont perdu parce qu'ils ont construit trop tôt, en trop grande quantité, dans des endroits sans trafic, ou parce qu'ils ont emprunté trop cher pour construire une voie trop lente à rentabiliser.

C'est la même chose pour la fibre optique pendant la bulle Internet. La fibre n'est pas en cause. Elle a ensuite soutenu le monde entier. Le problème était ces bilans qui ont compressé des décennies de demande future en quelques années de dépenses d'investissement.

Les centres de données d'IA laisseront probablement aussi beaucoup de choses utiles. Les GPU se déprécieront, les contrats d'électricité seront renouvelés, les centres de données changeront d'équipement, les logiciels consommeront de plus en plus de puissance de calcul. La consommation de tokens qui semble exagérée aujourd'hui deviendra peut-être aussi banale que le trafic vidéo haute définition dans quelques années.

Mais les actifs ont leur propre caractère.

Ils ne se soucient pas de savoir si vous croyez en l'avenir. Ils se soucient seulement de savoir si quelqu'un vient les utiliser chaque jour.

Le signal de Meta vendant de la puissance de calcul se trouve à ce carrefour.

Ce n'est pas la fin de l'IA. Ce n'est pas non plus la fin des semi-conducteurs. C'est plutôt le moment où, au milieu du récit des dépenses d'investissement, quelqu'un ouvre la porte pour la première fois, laissant les gens voir combien de machines sont dans l'entrepôt.

Certaines machines seront consommées par les modèles de pointe.

Certaines machines seront louées par des clients cloud.

Certaines machines deviendront moins chères dans une guerre des prix.

Et certaines machines attendront tranquillement une application qui n'existe pas encore.

Ces deux dernières années, le marché était prêt à croire que toutes les machines attendraient finalement leur destin. Maintenant, il commence à se demander qui attendra le premier, qui n'attendra pas, et qui attendra sans gagner assez d'argent.

Une fois cette question posée, l'histoire de l'IA change.

Elle n'appartient plus seulement à ceux qui achètent les machines le plus vite.

Elle appartient à ceux qui peuvent faire tourner les machines en continu.

Lien original

Cliquez pour découvrir les postes à pourvoir chez BlockBeats

Bienvenue dans la communauté officielle de BlockBeats :

Chaîne d'abonnement Telegram : https://t.me/theblockbeats

Groupe de discussion Telegram : https://t.me/BlockBeats_App

Compte Twitter officiel : https://twitter.com/BlockBeatsAsia

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé