De forcer les employés à utiliser l'IA à craindre de brûler trop de tokens : de plus en plus d'entreprises resserrent les quotas d'utilisation interne de l'IA

Les entreprises ont passé un an à forcer leurs employés à utiliser l'IA, et maintenant elles doivent les empêcher d'en abuser. D'Accenture interdisant aux employés d'utiliser l'IA pour convertir des PDF, à Uber qui a épuisé son budget IA annuel dès avril, en passant par Amazon et Meta qui resserrent simultanément les quotas, l'ère du « tokenmaxxing » est morte. Les dirigeants attendent encore la réponse à la question : le modèle économique de l'IA vaut-il vraiment son prix ?
(Rappel : La fin des tokens arrive : la hausse des prix des tokens de GitHub Copilot suscite des critiques négatives, l'industrie de l'IA passe entièrement à la facturation à l'usage)
(Contexte : GitHub Copilot modifie sa tarification, révélant le « plus grand mensonge » de l'industrie de l'IA)

Table des matières

Toggle

  • Des classements aux interdictions
  • Pourquoi la facture explose-t-elle ?
  • Le modèle économique de l'IA remis en question

Il y a un an, les entreprises disaient à leurs employés : ne pas utiliser l'IA pourrait vous coûter une promotion. Aujourd'hui, les mêmes entreprises se réunissent pour discuter de la manière d'empêcher leurs employés d'utiliser l'IA pour faire des PowerPoint. Accenture, Uber, Amazon, Meta, Walmart, Cisco : ces entreprises ont presque simultanément annoncé au premier semestre 2026 un resserrement des quotas internes d'utilisation de l'IA. Leur dilemme commun est unique : elles ont dépensé des sommes colossales dans l'IA, mais ne peuvent pas dire clairement ce qu'elles ont obtenu en retour ?

Des classements aux interdictions

L'absurdité de la situation réside dans le fait que de nombreuses entreprises ont elles-mêmes poussé leurs employés dans ce piège.

Il n'y a pas si longtemps, certaines entreprises avaient même mis en place des classements d'utilisation de l'IA par les employés, encourageant une utilisation massive. Accenture a même laissé entendre à ses employés que ne pas utiliser l'IA « pourrait leur faire perdre des opportunités de promotion ». C'était une logique de gestion raisonnable : pour promouvoir la transformation numérique, il faut que l'organisation développe des habitudes d'utilisation.

Résultat : les habitudes ont été prises, mais l'usage a dévié. Selon un enregistrement d'une réunion interne d'Accenture obtenu par 404 Media, les employés ont commencé à utiliser les réserves de tokens de l'entreprise pour des tâches de base, comme convertir des PDF en diapositives de présentation. Ces tâches ne créent aucune valeur commerciale, mais chaque opération brûle de l'argent.

Justice Kwak, responsable de la stratégie d'IA agentique chez Accenture, a directement identifié le cœur du problème :

« Nous arrivons à un point de bascule où l'IA commence à devenir une part importante de la structure de coûts ; les dépenses deviennent très imprévisibles, et les hauts dirigeants, en particulier au niveau des CFO, COO, CIO, se demandent encore si l'argent que nous dépensons dans l'IA a réellement apporté de la valeur. »

La situation chez Uber est encore plus extrême. L'entreprise a épuisé tout son budget IA annuel en avril 2026, et a été contrainte d'imposer des limites d'urgence : chaque employé dispose d'un plafond mensuel de tokens de 1 500 dollars pour les outils de codage agentique (comme Claude Code, Cursor). Avant cette limitation, les factures mensuelles des ingénieurs logiciels individuelles se situaient entre 500 et 2 000 dollars. L'évaluation d'Andrew Macdonald, président et directeur des opérations d'Uber, est brutalement honnête : « Le lien entre l'utilisation massive de Claude Code par l'entreprise et l'innovation au service des consommateurs n'existe pas encore. »

Pourquoi la facture explose-t-elle ?

En 2025, le principal modèle économique d'Anthropic et d'OpenAI était l'abonnement mensuel fixe. En termes simples, l'entreprise paie un montant fixe, les employés peuvent utiliser les outils d'IA, comme un abonnement à Office 365, sans frais supplémentaires en cas de dépassement. Ce modèle encourageait une utilisation intensive.

Cependant, en 2026, les deux entreprises ont converti la plupart de leurs offres destinées aux entreprises en facturation à l'usage basée sur les tokens. Un « token » est l'unité de base du traitement du texte par les modèles d'IA. En termes clairs, chaque fois que le modèle lit un mot ou en écrit un, il est facturé. L'utilisation dans une interface de chat classique est limitée et la facture est maîtrisable. Mais avec l'IA agentique, c'est-à-dire les agents d'IA capables d'exécuter automatiquement des tâches en plusieurs étapes, comme écrire du code, rechercher des données, envoyer des requêtes, chaque tâche accomplie peut consommer des dizaines de milliers de tokens, et la structure de la facture est complètement différente.

C'est la raison fondamentale de l'explosion des factures des entreprises : les outils auparavant payés mensuellement sont désormais facturés à chaque opération de calcul, et l'utilisation des agents automatisés n'est presque pas limitée naturellement par le comportement humain.

Le terme « Token rationing » (rationnement des tokens) circule actuellement en interne dans les entreprises. En résumé, les quotas d'utilisation de l'IA commencent à être contrôlés, de la même manière que les entreprises contrôlent les frais de déplacement ou les licences logicielles.

Le modèle économique de l'IA remis en question

Ce n'est pas seulement une décision d'économie de quelques entreprises, c'est le premier véritable test de résistance du modèle économique de toute l'industrie de l'IA.

Le New York Times a baptisé cette tendance « token-minimizing » et souligne que les entreprises réexaminent systématiquement le retour sur investissement (ROI) de leurs dépenses en IA. Fortune est encore plus direct : le tokenmaxxing est mort, les entreprises n'ont pas obtenu le retour qu'elles espéraient au départ.

D'un point de vue technique, les capacités des modèles d'IA continuent effectivement de progresser. Mais il existe un fossé, toujours non comblé, entre « l'amélioration des capacités des modèles » et « les bénéfices réels pour les entreprises ». Macdonald d'Uber a exprimé le sentiment de nombreux CXO : les employés ont produit une grande quantité de code avec Claude Code, mais personne ne peut établir un lien clair entre ce code et l'amélioration de l'expérience des utilisateurs finaux.

L'industrie de l'IA a dépassé la phase où « la nouveauté et l'excitation » pouvaient tout justifier. Elle doit maintenant faire face à une question ennuyeuse mais cruciale : le retour sur investissement.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé