Une autre tendance du marché de l'IA : OpenAI doit également baisser ses prix

Résumé

· Un cadre supérieur d'Uber a déclaré directement que le lien entre la consommation de tokens et l'amélioration des produits réels « n'existe pas encore » ; OpenAI a également reconnu que le coût de l'IA pour les entreprises devient un problème de plus en plus concret.

· La demande pour l'IA n'a pas disparu, mais les entreprises commencent à passer de l'essai à l'audit du ROI, les fournisseurs de modèles discutent de réductions de prix, et la croissance du cloud, des GPU et des centres de données doit être réévaluée.

· Actions associées : NVDA, MSFT, AMZN, GOOG, MU, AVGO, AMD, TSM, ARM, ORCL.

Après deux mois de hausse continue, le marché des actions américaines liées à l'IA commence à se corriger, et le marché cherche maintenant des raisons de manière plus explicite.

Les taux d'intérêt, la surévaluation, les perturbations des résultats financiers peuvent expliquer cette correction, mais le marché examine également une hypothèse plus fondamentale : la consommation accrue de tokens par les entreprises entraîne-t-elle forcément plus de revenus, d'efficacité et de profit ?

Au cours des deux dernières années, la chaîne de l'IA dans le trading a été très fluide. Les entreprises utilisent massivement l'IA, la consommation de tokens (unité de mesure du traitement de texte par le modèle) augmente, les revenus des fournisseurs de modèles croissent, les fournisseurs de cloud vendent plus de puissance de calcul, et la demande pour GPU, HBM (mémoire à haute bande passante), serveurs, centres de données et électricité continue de s'étendre. Tant que la consommation de tokens continue d'augmenter, le marché peut la considérer comme une accélération de l'adoption de l'IA, valorisant davantage le matériel en amont et les investissements en capital.

Mais une évolution récente est que même les fournisseurs de modèles commencent à discuter des coûts.

Selon le Wall Street Journal, OpenAI étudie une réduction supplémentaire des prix d'appel des modèles pour faire face à la pression budgétaire des entreprises et à la concurrence d'acteurs comme Anthropic. Par ailleurs, le PDG d'OpenAI, Sam Altman, a récemment déclaré publiquement que de plus en plus d'entreprises considèrent le coût de l'IA comme une question cruciale, certains clients ayant même consommé leur budget annuel d'IA dès le premier trimestre.

Cela ne suffirait peut-être pas à changer la configuration du secteur, mais cela envoie un signal important : le marché ne discute plus seulement des capacités des modèles, mais aussi des coûts, des prix et du retour sur investissement.

Ce qui se détend maintenant, ce n'est pas « si les entreprises utilisent encore l'IA », mais « si elles sont prêtes à continuer à payer inconditionnellement pour des tokens coûteux ».

Andrew Macdonald, président et COO d'Uber, a déclaré dans un podcast que le lien entre la croissance de la consommation de tokens et « des fonctionnalités utiles pour le consommateur » « n'existe pas encore ». Cette déclaration vient du côté des acheteurs, et non des vendeurs, banques d'investissement ou startups de modèles.

Si le marché croyait auparavant que « la quantité d'utilisation équivaut au succès », nous entrons maintenant dans une deuxième phase : le token peut-il finalement se transformer en croissance de revenus, réduction des coûts de main-d'œuvre ou amélioration de la marge bénéficiaire ? Si cette question est systématiquement posée par le département financier, la valorisation de la chaîne de l'IA passera d'une « demande infinie » à une « validation du retour ».

La forte adoption par Uber expose la pression budgétaire

L'exemple d'Uber mérite d'être examiné, non pas parce qu'il ne comprend pas l'IA, ni parce qu'il ne veut pas l'utiliser. Au contraire, l'adoption des outils d'IA en interne chez Uber est très élevée. Selon plusieurs médias, parmi environ 5000 ingénieurs, le taux d'utilisation mensuelle a atteint entre 84 % et 95 %, avec une facture mensuelle par ingénieur allant de quelques centaines à 2000 dollars.

Le problème est ici. Lorsque le taux d'utilisation est suffisamment élevé, la facture ne devient plus une petite dépense pour un département d'innovation, mais une véritable charge à expliquer à la direction opérationnelle. Selon le CTO de l'entreprise, le budget annuel pour Claude Code chez Uber a été épuisé en 4 mois. Macdonald décrit cela comme un moment « à faire exploser la tête ».

Dans l'entreprise, les outils d'IA entrent d'abord dans le budget sous le prétexte d'« amélioration de l'efficacité ». Les ingénieurs génèrent du code plus rapidement, le service client répond plus vite, l'équipe opérationnelle rédige des rapports plus rapidement — autant de changements facilement perceptibles.

Mais une fois que l'utilisation s'élargit, la finance regarde des questions plus dures : cela a-t-il généré plus de revenus ? A-t-il réduit les coûts réels de main-d'œuvre ? A-t-il amélioré la marge ?

Le phénomène de « tokenmaxxing » mentionné par Macdonald montre aussi que la forte consommation peut être déconnectée de la valeur réelle. Le tokenmaxxing désigne le fait qu'une équipe ou un individu consomme massivement des tokens pour maximiser leur usage de l'IA. Les données d'utilisation semblent bonnes, mais ne garantissent pas forcément de meilleurs résultats produits. Pour le fournisseur de services IA, c'est du revenu ; pour l'entreprise, cela peut simplement être une facture cloud hors de contrôle.

Le signal d'Uber est plus important que le simple « IA trop chère ».

Il ne s'agit pas de dire que l'IA est inutile, mais que lorsque l'IA passe du budget d'essai à celui d'exploitation, l'entreprise doit prouver que chaque dollar dépensé en tokens génère un résultat commercial mesurable. Une forte adoption ne signifie plus automatiquement le succès, mais expose en premier lieu la structure des coûts.

La pression sur les coûts se diffuse dans toute la chaîne

Les acheteurs d'entreprise commencent à faire leurs comptes, et les plateformes modifient aussi leur tarification.

GitHub a annoncé qu'à partir du 1er juin 2026, Copilot passera à un modèle de facturation basé sur la consommation, avec l'introduction de crédits AI mensuels. Pour les utilisateurs occasionnels, cela peut simplement changer la structure de la facture ; pour les développeurs intensifs, certains rapportent que le coût par session peut atteindre plusieurs dizaines de dollars, ce qui alimente les discussions communautaires.

Cela signifie que la plateforme ne veut plus couvrir entièrement le coût d'utilisation illimitée des tokens dans le cadre d'un abonnement fixe.

Auparavant, l'utilisateur payait un abonnement mensuel, et la plateforme assumait le coût des appels au modèle en arrière-plan. Maintenant, avec l'augmentation du nombre d'appels, de la longueur du contexte et des tâches multi-tours, le coût devient explicite. Plus on utilise, plus on paie — une correction de la narration « IA illimitée ».

Ce qui est encore plus important, c'est que cette pression se transmet désormais du niveau de l'application à celui du modèle.

Au cours des deux dernières années, la narration dominante dans le secteur des grands modèles était la réduction des coûts et l'expansion à grande échelle. Mais avec la montée en puissance des départements d'achat des entreprises qui commencent à auditer le ROI, les fournisseurs de modèles font face à de nouveaux défis : si les clients ne veulent plus payer des tokens coûteux, comment continuer à croître ?

Les signaux récents d'OpenAI sont typiques. D'un côté, Sam Altman admet que le budget des entreprises est sous pression ; de l'autre, des rumeurs indiquent qu'OpenAI étudie une nouvelle réduction de prix. Cela signifie que l'attention du secteur passe de « capacité du modèle » à « coût par unité d'intelligence ».

Pour les clients, la question clé n'est plus « quel modèle est le plus puissant », mais « quel modèle peut générer plus de résultats avec le même budget ».

Microsoft réduit également ses licences Claude Code, dans la même optique. Selon The Verge, Axios, TechRadar, Microsoft a annulé la majorité de ses licences internes pour Claude Code et se tourne vers ses propres outils Copilot. La taille et les raisons exactes restent à préciser, mais cela ne peut pas être considéré comme une confirmation que Microsoft réduit ses achats externes pour des raisons de coût.

Mais cette démarche montre au moins que les grandes entreprises technologiques réallouent leurs coûts d'appels aux modèles externes.

L'impact sur la chaîne de l'IA ne réside pas dans la perte de revenus d'un seul outil, mais dans la transmission de la discipline d'achat vers le haut. Les entreprises peuvent limiter leurs quotas, choisir des modèles moins chers, transférer certains tâches vers l'open source ou l'auto-développement, ou demander des remises aux fournisseurs. Les fournisseurs de modèles et les entreprises d'applications auront toujours des besoins, mais le pouvoir de fixation des prix ne dépend plus uniquement de la « puissance du modèle », mais aussi de la capacité du client à « faire ses comptes ».

Les fournisseurs de cloud seront également affectés. La narration précédente sur le cloud était très axée sur l'IA : entraînement, inférence, applications d'entreprise nécessitent de la puissance de calcul, et plus la consommation de tokens est élevée, plus la demande cloud est certaine. Mais si les entreprises commencent à réduire le coût unitaire par token ou à transférer des tâches à faible valeur à des chemins d'inférence moins chers, la flexibilité des revenus cloud pourrait être inférieure aux attentes.

Une consommation élevée doit prouver une grande valeur

Les entreprises commencent à auditer à ce moment précis, en partie parce que l'utilisation de l'IA est devenue suffisamment importante pour que les inefficacités ne soient plus facilement ignorées.

Une étude d'Entelligence.AI publiée en mai 2026 a analysé 2444 organisations et plus d'un million de Pull Requests. Selon leur estimation, pour chaque dollar dépensé en tokens IA, seulement 0,18 dollar génère une valeur réelle pour l'utilisateur, 0,44 dollar sert à corriger les bugs introduits par l'IA, 0,27 dollar à refaire le travail, et 0,11 dollar est consommé dans la friction de la revue.

Ce chiffre ne peut pas être généralisé à toute l'industrie. Il provient d'une étude interne du fournisseur, principalement dans le contexte du génie logiciel, et non d'une audit indépendante ou d'une publication académique. Mais il montre une chose : les entreprises ressentent une pression pour l'audit du ROI, surtout dans les scénarios où le contenu généré par l'IA doit encore être vérifié, corrigé et intégré par des humains.

L'outil d'IA le plus facile à démontrer est la vitesse de génération, mais ce que les entreprises paient réellement, c'est le résultat livrable. Si le code généré par l'IA introduit plus de bugs, nécessitant plus de revue, de rework et de tests, le gain de temps en front-end sera compensé par une charge accrue en back-end. Pour un utilisateur individuel, cela peut n'être qu'un problème d'expérience ; pour une grande entreprise, cela devient une question financière et organisationnelle.

Cela explique aussi pourquoi la croissance de la consommation de tokens ne peut plus être simplement assimilée au succès de l'IA.

Les tokens sont à la fois l'unité de facturation des revenus et la mesure des coûts. Pour les fournisseurs de modèles, plus de tokens signifie plus de revenus ; pour les entreprises, plus de tokens ne vaut la peine que si cela génère plus de revenus, réduit les coûts ou améliore la marge.

Si le marché considérait auparavant la croissance des tokens comme un indicateur avancé de la demande matérielle, il doit maintenant aussi prendre en compte le taux de conversion de la valeur des tokens. Ce n'est que lorsque la consommation de tokens se traduit de manière stable en résultats commerciaux que les revenus des fournisseurs cloud, les commandes de GPU, l'expansion de la HBM et la construction de centres de données auront un support plus solide.

La volonté de payer se transmettra dans toute la chaîne

Le stratégiste macroéconomique Andreas Steno Larsen a récemment souligné que l'indice de dépense en tokens LLM (Large Language Model) de Silicon Data est l'un des graphiques à suivre dans le marché actuel. Selon des rapports, cet indice suit les dépenses ou le prix payé par les entreprises pour chaque million de tokens, et après une hausse significative début 2026, il montre une tendance de recul fin mai.

Il faut garder une certaine réserve. La page publique de Silicon Data est principalement une présentation de produits, et la méthode de calcul ainsi que l'historique complet ne sont pas entièrement divulgués. Cela ne peut pas être considéré comme une conclusion ferme, mais comme un signal d'observation de la volonté de paiement des entreprises.

Une baisse de l'indice de dépense en tokens ne signifie pas nécessairement une baisse de l'utilisation de l'IA.

En réalité, le marché semble assister à une transition de la « compétition en puissance de calcul » vers la « compétition en coût par unité d'intelligence ». Les entreprises ont toujours besoin d'IA, mais ne veulent peut-être plus continuer à acheter selon l'ancien modèle de prix.

Si OpenAI lance une nouvelle réduction de prix, cela soulagera la pression budgétaire des entreprises, mais marquera aussi l'entrée officielle du secteur dans une phase de guerre des prix. Le marché devra alors réévaluer : la croissance future proviendra-t-elle de la demande additionnelle ou de l'expansion de l'utilisation suite à la baisse des prix ?

La demande pour l'IA pourrait encore croître, mais la valeur générée par cette croissance et la transmission en amont pourraient changer.

Les impacts varient selon les segments. Au niveau de l'application et des modèles, la première réaction sera la pression sur les prix : les entreprises demanderont un ROI plus clair, réduiront les appels à faible valeur ou feront des arbitrages entre modèles.

Les fournisseurs de cloud seront confrontés à un problème de flexibilité des revenus : si la consommation reste la même, mais que le prix unitaire baisse, ou que le cache et le traitement par lots augmentent, la croissance des revenus cloud pourrait être inférieure à celle de la consommation totale de tokens.

Plus en amont, la demande en GPU, HBM, emballages avancés, serveurs et centres de données concerne les investissements futurs en capital. Si la discipline de paiement des entreprises pousse les fournisseurs de modèles et de cloud à être plus prudents, la planification des commandes matérielles et la construction de centres seront réévaluées.

Larsen met en garde : cela ne signifie pas que la demande matérielle disparaît immédiatement, mais si la tarification des tokens continue de s'affaiblir, le marché commencera à douter de la pente du cycle d'investissement dans l'infrastructure IA.

Il ne s'agit pas d'un lien de causalité simple entre la correction des actions IA et l'audit des factures de tokens. On ne peut pas dire que la chute des actions des semi-conducteurs est due à Uber ayant épuisé son budget, mais ils évoluent dans la même chaîne : lorsque la valorisation reflète déjà une croissance à long terme, tout signal concernant la volonté de paiement finale et le ROI sera amplifié en une réévaluation des investissements en amont.

Prochainement, il faudra regarder la résilience des revenus dans les résultats financiers et le rythme des commandes

Les preuves actuelles ne permettent pas encore d'affirmer que « la bulle IA a éclaté ». Les entreprises continuent d'utiliser l'IA, et les développeurs ne reviendront pas à un état sans Copilot, Claude ou autres outils intelligents. Une évaluation plus raisonnable est que l'adoption de l'IA passe d'une phase d'enthousiasme précoce à une phase de discipline budgétaire, où le marché commence à distinguer les cas d'usage qui prouvent un retour, et ceux qui ne font que générer des factures.

Les prochains indicateurs clés seront les changements dans le langage des résultats financiers des cloud et des entreprises de logiciels : la croissance des revenus IA de Microsoft, Amazon, Google peut-elle continuer à être très flexible ? La rétention, la réduction ou les plaintes concernant des outils comme Copilot ou Claude Code après la facturation à l'usage, seront-ils des signaux plus révélateurs que le simple cours de l'action ?

Du côté matériel, il faudra surveiller si les commandes de GPU, HBM et centres de données sont en baisse. Si les dépenses en capital des cloud continuent d'augmenter, et si les commandes de puces avancées restent tendues, la baisse de la volonté de payer en tokens ressemblera davantage à un ajustement sain. Si la flexibilité des revenus IA se détériore, et que la cadence des commandes matérielles et de la construction de centres ralentit, le marché pourrait l'intégrer comme un tournant plus profond du cycle.

Le marché de l'IA n'est pas terminé, mais sa façon de se valoriser change. Autrefois, le marché se demandait « combien de tokens ont été utilisés », maintenant il faut aussi se demander « combien de profit ces tokens ont finalement généré ». Cet écart déterminera la direction de la différenciation des valorisations dans la chaîne de l'IA.

Cliquez pour découvrir les opportunités chez律动BlockBeats

Rejoignez la communauté officielle de律动BlockBeats :

Groupe Telegram : https://t.me/theblockbeats

Groupe Telegram : https://t.me/BlockBeats_App

Compte officiel Twitter : https://twitter.com/BlockBeatsAsia

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé