Oubliez les limites 1 entreprise 1 mois à brûler 500 millions de dollars avec Claude

robot
Création du résumé en cours

Auteur : Bao Yilong ; Source : Wallstreet Jingwen

La vague d'engouement pour l'IA d'entreprise rencontre sa première véritable crise de facturation.

Le 28 mai, selon Axios citant un conseiller en IA, un client d'une entreprise appartenant à cette société a récemment dépensé 500 millions de dollars en un seul mois pour Claude, simplement parce qu'aucune limite n'avait été fixée sur l'utilisation par les employés.

L'analyse indique que de nombreuses entreprises, en déployant rapidement des outils d'IA, se concentrent sur les fonctionnalités et la promotion, tout en négligeant la mise en place de mécanismes de contrôle des coûts.

Microsoft, Amazon et d'autres géants technologiques prennent des mesures, réduisant leurs outils d'IA internes ou suspendant les projets de suivi de l'utilisation de l'IA, afin de freiner ce qui est appelé le "tokenmaxxing" (maximisation des jetons), un comportement d'épuisement excessif.

Un vice-président senior d'Amazon a dû avertir ses employés :

Ne faites pas de l'IA pour faire de l'IA.

Le problème central auquel le marché est confronté n'est plus "faut-il adopter l'IA", mais "nous avons dépensé autant d'argent, qu'avons-nous réellement obtenu en retour ?"

Amazon ferme ses classements internes "pour booster le score" et le coût réel engendré

Le cas d'Amazon révèle sous un autre angle la difficulté de la gouvernance de l'IA en entreprise.

Selon des sources proches du dossier, Amazon a mis en place une plateforme de développement appelée Kiro, avec un classement interne nommé "Kirorank", basé sur l'activité des employés dans l'utilisation de l'IA.

Cependant, ce classement a involontairement incité certains employés à faire exécuter des tâches sans intérêt par des agents IA pour améliorer leur position, ce qui a directement augmenté la consommation de puissance de calcul de l'entreprise.

Ce semaine, Dave Treadwell, vice-président senior d'Amazon, a reconnu aux employés que ce classement, bien que bien intentionné, a finalement conduit à une augmentation des coûts opérationnels via le "tokenmaxxing".

Il a clairement indiqué aux employés de ne pas se concentrer sur la consommation de tokens, mais plutôt sur la création de meilleurs produits, en insistant : "Ne faites pas de l'IA pour faire de l'IA".

Amazon a ensuite confirmé dans un communiqué que cette version de test du tableau de bord "n'était pas un outil officiel ou approuvé, et a été retirée".

Meta a connu une situation similaire, où des employés ont également tenté d'améliorer leur classement interne en augmentant la consommation de tokens.

Ce phénomène montre que, lorsque l'utilisation de l'IA est intégrée dans l'évaluation des employés, cela peut avoir l'effet inverse, en incitant à une consommation inutile de puissance de calcul.

Par la suite, Amazon a remplacé la mesure du "token" par un indicateur de "déploiement normalisé", se concentrant sur la capacité des ingénieurs à générer en continu du code utile via l'IA.

Il est à noter que les dépenses en capital d'Amazon cette année devraient atteindre 200 milliards de dollars, la majorité étant consacrée à l'IA et aux infrastructures de centres de données.

Les quatre grands enjeux : pourquoi l'argent dépensé pour l'IA ne rapporte pas

Selon Axios, l'adoption de l'IA en entreprise fait face à quatre obstacles structurels.

Mauvaise sélection des cas d'usage. Sophia Velastegui, CEO de Velastegui Ventures et ancienne directrice de l'IA chez Microsoft, indique que la majorité des gens ont tendance à utiliser l'IA pour automatiser des tâches qu'ils n'aiment pas, plutôt que celles qui apportent le plus de valeur à l'entreprise.

Elle pense que les ressources en IA devraient être concentrées sur des scénarios qui peuvent directement augmenter le chiffre d'affaires, plutôt que d'être déployées aveuglément.

Manque de contrôle des coûts. Les requêtes en IA ne sont pas sans coût : les forfaits d'entreprise facturent par token, et même des requêtes simples quotidiennes peuvent rapidement entraîner des dépenses importantes, sans que la plupart des départements en aient une compréhension claire.

L'humain est le plus grand frein. Velastegui qualifie la pratique courante dans les entreprises d'"autorisation d'IA en mode dispersion", comme une voie qui ne peut pas apporter de retours substantiels.

Les entreprises déploient massivement des outils d'IA aux employés, mais manquent d'orientation et de focalisation efficaces, ce qui entraîne une faible adoption réelle.

Les préoccupations liées à la confidentialité des données. Josh Pantony, CEO de Boosted.ai, spécialisé dans l'IA financière, souligne que lorsque les entreprises hésitent à partager leurs données internes sensibles avec des agents IA par souci de sécurité, l'efficacité réelle de ces agents en pâtit, rendant le retour sur investissement difficile.

L'économie des tokens : la nouvelle variable centrale dans la narration de l'IA

Derrière cette controverse, une logique d'investissement plus complexe est en train de se reconfigurer.

Wallstreet Jingwen mentionne, selon le dernier point de Rich Privorotsky, responsable de la division One-Delta chez Goldman Sachs, que la variable clé dans le trading d'IA est passée de "la faisabilité technique" à "le coût supportable".

DeepSeek aurait réduit de 75 % le prix des tokens, et Xiaomi MiMo aurait presque réduit ses prix de 99 %, ce qui pourrait déclencher une "guerre des prix" similaire à celle des subventions.

Il indique que les goulets d'étranglement en infrastructure finiront par se résorber, et que le marché ne devrait pas payer une prime excessive pour des "problèmes qui seront bientôt résolus".

Privorotsky propose également l'hypothèse que des tokens moins chers pourraient rapidement remplacer les services de raisonnement coûteux. Si la demande connaît un retard dans sa croissance, les revenus des fournisseurs de cloud, des fabricants de modèles et des infrastructures IA pourraient connaître une pression à la baisse à court terme.

Il pense que la rationalisation des dépenses en tokens pourrait devenir un sujet clé pour les conseils d'administration au cours du deuxième et du troisième trimestre de cette année, aussi important que la narration de croissance de l'IA elle-même.

Selon l'indice Bloomberg Silicon Data LLM Token Expenditure, le prix des tokens a augmenté d'environ 65 % depuis fin février, et les prix des logiciels IA américains ont augmenté de 20 à 37 % au cours de la dernière année.

Cette tendance de coûts pousse les entreprises à réévaluer leurs stratégies d'achat d'IA. Lorsque "obtenir 90 % du résultat pour 10 % du coût" devient de plus en plus réalisable, la dépendance aux modèles de pointe coûteux pourrait diminuer de façon systématique.

Ali Ansari, CEO de Micro1, une société de formation de modèles IA, indique que les entreprises vivent une "oscillation saine" entre une utilisation excessive de l'IA et une utilisation rationnelle. Selon lui :

Actuellement, le seul domaine où l'IA est vraiment efficace, c'est la programmation.

La bataille entre optimistes et pessimistes : la même réalité, deux interprétations

En ce qui concerne le retour sur investissement de l'IA, les mêmes données mènent à des conclusions diamétralement opposées selon le cadre d'analyse.

Les optimistes considèrent que le chaos actuel n'est qu'une douleur normale dans le processus de transformation.

Selon Jim Schneider de Goldman Sachs, début mai, d'ici 2030, l'IA basée sur des agents pourrait multiplier par 24 la consommation de tokens, et la marge brute des grands fournisseurs de cloud et de modèles pourrait devenir positive dans les 3 à 12 mois à venir.

Une étude de JP Morgan montre également qu'au début de 2026, la croissance en saut de Python sur PyPI a commencé, alors que cette tendance n'était pas visible lors du lancement de ChatGPT en 2022, ce qui indique une véritable augmentation de la productivité.

Les pessimistes, quant à eux, expliquent dans un rapport d'avril de Jim Covello, analyste en semi-conducteurs chez Goldman Sachs, que presque toute la valeur dans la chaîne d'approvisionnement de l'IA va aux fabricants de semi-conducteurs, ce qui est sans précédent dans l'histoire et insoutenable. Les fabricants de puces devraient bénéficier lorsque les clients en tireront profit, mais cette période de prospérité est alimentée par la consommation en amont de toute la chaîne industrielle.

Les deux narrations coexistent, et la victoire n'est pas encore décidée. Ce qui est certain, c'est que l'équation simpliste "augmentation de la consommation de tokens = succès de la transformation IA" a été brisée.

Du cas extrême de dépenser 500 millions de dollars en un mois, à l'arrêt du classement interne d'Amazon, l'investissement dans l'IA subit une évaluation plus rigoureuse de ses retours. La prochaine facture d'IA, et la valeur réelle qu'elle pourra générer, seront le véritable jugement de cette grande mise en jeu.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé