Au premier semestre de cette année, la « maximisation des tokens » (Tokenmaxxing) est devenue un mot à la mode dans le monde de l'IA en entreprise. Des entreprises comme Meta et Salesforce ont activement encouragé leurs employés à consommer autant de tokens d'IA que possible pour améliorer leur productivité. Un classement appelé « Claudeconomics » est même apparu en interne chez Meta, suivant les 250 plus gros utilisateurs de l'entreprise. Les données montrent que les employés de Meta ont consommé plus de 60 billions de tokens en 30 jours, le plus gros consommateur individuel atteignant environ 280 milliards de tokens. Afin de gagner des titres comme « Légende des tokens » ou « Sorcier du cache », les employés ont laissé leurs agents d'IA passer des heures à faire des recherches inutiles pour « brûler des tokens ».

Ensuite, Uber a fait la une pour avoir épuisé en quatre mois le budget annuel de Claude Code et Codex, imposant immédiatement une limite mensuelle de 1500 dollars par employé, avec un dépassement nécessitant une approbation au cas par cas.

Ces événements ont suscité une large attention. Cependant, après une enquête de terrain lors du Databricks AI Summit et des échanges approfondis avec plus de 50 clients entreprises via Slack et par téléphone, l'équipe SemiAnalysis est parvenue à une conclusion très différente du récit médiatique.

L'institution estime que les articles des médias ont gravement exagéré l'ampleur du problème. Les cas extrêmes de Meta et Uber sont dus à une mauvaise gestion des incitations et à un relâchement interne, et non à une perte de contrôle globale des investissements en IA des entreprises.

Les histoires à la une sont exagérées, les données réelles sont plus douces

Les médias ont peut-être exagéré la crise des budgets d'IA en entreprise.

Les données clés soutiennent ce jugement. SemiAnalysis cite les données de dépenses de Ramp, montrant que le top 1% des clients dépense en moyenne 90 000 dollars par employé et par an en IA, le top 10% environ 7 300 dollars, tandis que la médiane des clients de Ramp n'est que de 136 dollars. Les clients de Ramp ont un niveau d'adoption technologique bien supérieur à celui des entreprises ordinaires, mais les dépenses moyennes en IA par employé des clients médiatiques du Fortune 500 restent bien inférieures à 100 dollars.

Même pour Meta, le « grand brûleur de tokens », le coût annuel par employé est proche de 50 000 dollars au prix catalogue, ce qui ne représenterait que 3 à 5 % des revenus clients d'Anthropic, selon les estimations de SemiAnalysis.

La documentation d'Anthropic le confirme également : les développeurs Claude Code dépensent en moyenne 150 à 250 dollars par mois, et seulement 10 % des utilisateurs dépensent plus de 30 dollars par jour.

SemiAnalysis estime : « Les reportages exagérés des médias ne sont pas vrais – les entreprises continuent d'investir, la consommation de tokens générée par de nouveaux scénarios de demande et domaines verticaux pousse le train de l'IA à avancer rapidement. »

Cela signifie que l'adoption de l'IA en entreprise est encore dans une phase de diffusion inégale. Tous les employés n'utilisent pas fréquemment les grands modèles. Dans de nombreuses entreprises, seules quelques équipes et postes sont en avance.

La gestion budgétaire devient la nouvelle norme, mais les standards sont très variables

Parmi les plus de 50 entreprises interrogées, la plupart ont imposé des limites strictes à l'utilisation de l'IA. Mais les critères varient considérablement d'une entreprise à l'autre, sans consensus sectoriel.

Cas bas :

Fabricant aérospatial et de défense classé top 3 aux États-Unis : limite de 250 dollars par personne par mois, certains gros utilisateurs épuisant leur quota dès le quatrième jour du premier mois.
Une des plus grandes entreprises pharmaceutiques au monde : 500 dollars par personne par mois, avec possibilité de demander 1 000 dollars dans des cas spéciaux.

Cas hauts :

Workday, Stripe : budget mensuel par employé d'environ 2 000 dollars.
Entreprise de cybersécurité cotée en bourse : 800 dollars par mois pour les employés juniors, 1 600 à 4 000 dollars pour les seniors, avec les data scientists bénéficiant des plus hauts plafonds.
Grande entreprise technologique de voyage (800 ingénieurs sur 1 500 employés, dépenses annuelles en IA proches de 10 millions de dollars) : 200 dollars par défaut par personne par mois, pouvant être augmenté jusqu'à plusieurs dizaines de milliers de dollars selon le poste.

La logique de définition des budgets varie également. Le cas le plus particulier est celui d'une des trois grandes compagnies aériennes américaines : l'attribution des tokens est directement liée aux projets spécifiques et aux revenus attendus. Par exemple, pour un projet avec un chiffre d'affaires prévu de 10 millions de dollars, l'équipe financière approuve un budget total de 1 million de dollars, et l'équipe décide elle-même de la proportion à allouer aux tokens – les coûts d'IA sont intégrés dans le modèle financier du projet, et non dans un budget IT séparé.

Les règles de survie des employés pour « économiser les tokens »

La pression budgétaire a donné naissance à des stratégies pratiques d'économie de tokens.

La plus typique est « l'arbitrage Copilot » : les abonnés à Microsoft 365 Entreprise peuvent utiliser gratuitement et sans limite le chatbot Copilot standard, et cette utilisation n'est pas comptée dans le budget mensuel d'IA. Une grande entreprise néerlandaise de biens de consommation et de technologies de la santé a clairement indiqué que ses employés utilisent d'abord Copilot pour rédiger et intégrer des idées, puis font appel à Claude ou Codex pour les tâches finales, économisant ainsi les tokens mesurés.

La rétrogradation des modèles est également courante. L'entreprise technologique de voyage citée plus haut a basculé le modèle par défaut de Claude pour tous ses employés d'Opus à Sonnet, Opus restant utilisable mais nécessitant une sélection active. Le fabricant aérospatial et de défense, quant à lui, a purement « désactivé » Opus 4.8 et le mode rapide.

À ce sujet, l'équipe SemiAnalysis commente directement la logique des dirigeants : « Les dirigeants pensent qu'augmenter le budget de tokens des employés les pousserait à automatiser des tâches qui ne devraient pas être automatisées, comme la rédaction d'e-mails. Nous considérons ce point de vue anti-automatisation comme naïf. »

La demande de tokens bon marché continue de croître, le marché des endpoints TaaS/API ne refroidit pas

La gestion budgétaire ne signifie pas une réduction des appels. Les entreprises se soucient davantage du coût unitaire.

La demande de tokens bon marché reste forte. Les marchés des tokens-as-a-service/API endpoints pour les modèles de pointe et open source sont en croissance. Après inclusion d'AWS Bedrock dans les calculs, les estimations de SemiAnalysis pour la croissance globale d'AWS ce trimestre sont supérieures aux attentes du marché.

Les fournisseurs de TaaS se développent également. Le chiffre d'affaires annuel récurrent (ARR) combiné de Together, Fireworks, Baseten et autres a dépassé les 4 milliards de dollars.

Cela montre que la pression budgétaire des entreprises va modifier la structure des achats. Les problèmes pouvant être résolus avec des modèles bon marché ne nécessiteront pas d'appeler systématiquement les modèles les plus chers. La rétrogradation des modèles par défaut ne signifie pas une diminution de l'utilisation de l'IA, mais une réoptimisation de la courbe des coûts.

Le codage reste la demande la plus forte, le train de l'IA ne ralentit pas à cause des limites budgétaires

Le codage reste le principal moteur des revenus de l'IA actuellement, plus de 70 % de l'ARR d'OpenAI et d'Anthropic provenant de ce domaine. La part B2B d'Anthropic dépasse 90 % (environ 60 % pour OpenAI), ce qui rend sa structure de revenus plus dépendante et plus stable vis-à-vis des entreprises.

La prochaine vague de croissance devrait venir de la cybersécurité et du travail de cols blancs. Avec la pénétration accrue des produits Cowork, CoPilot, Codex et Computer dans les entreprises, le chemin de la croissance de l'ARR des laboratoires d'IA tiré par le marché du codage se reproduira dans des scénarios plus larges.

Actuellement, les dépenses moyennes en IA par employé de la plupart des entreprises du Fortune 500 sont encore bien inférieures à 2 000 dollars par an, principalement concentrées dans les départements d'ingénierie et de science des données. Cela signifie que la diffusion de l'IA dans les entreprises en est encore à un stade précoce ; l'espace de croissance n'a pas disparu, il a simplement changé de forme – passant de « brûler de l'argent sans limite » à « investir continuellement avec un budget ».

Le véritable ROI de l'IA : gains d'efficacité, mais les attentes de production augmentent également

Dans les entreprises interrogées, les cas d'amélioration de l'efficacité grâce à l'IA sont réels et significatifs.

Service de recrutement d'Amazon : le processus, du premier tri au placement en équipe, prenait auparavant 6 à 9 mois ; avec les outils d'IA, il a été réduit à 3 à 4 mois.
Une entreprise fournissant des services d'analyse de données à 85 % du Fortune 500 : un travail qui prenait une semaine est maintenant réalisé en quelques heures.

Mais l'autre côté des gains d'efficacité est une augmentation parallèle des attentes de production. Une employée d'une société de solutions de données juridiques et de gestion des risques a admis que sa charge de travail habituelle d'une semaine était compressée en quelques heures, « mais l'entreprise s'attendait à ce qu'elle fasse plus de travail, ce qui l'a rendue plus occupée qu'avant ».

SemiAnalysis souligne que les dépassements de tokens chez Uber et Meta sont fondamentalement dus à une mauvaise gestion des incitations et à un relâchement de la supervision, et non à un manque de scénarios à fort ROI. Malgré des licenciements massifs, Amazon recrute de nouveaux employés plus rapidement grâce aux gains d'efficacité apportés par les outils d'IA – c'est l'illustration la plus claire de l'IA comme « levier humain ».

Avertissement et clause de non-responsabilité

        Le marché comporte des risques, investissez avec prudence. Cet article ne constitue pas un conseil d'investissement personnel et ne tient pas compte des objectifs d'investissement, de la situation financière ou des besoins particuliers des utilisateurs. Les utilisateurs doivent déterminer si les opinions, points de vue ou conclusions contenus dans cet article sont adaptés à leur situation particulière. Toute décision d'investissement basée sur cet article relève de votre propre responsabilité.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
GateCompletesDividendDistribution
125,91K Popularité
#
StrategyBuybackSurges12%
6,97M Popularité
#
IsraelStrikesIranBTCPlunges
67,14K Popularité
#
PredictWorldCupShare20000U
523,6K Popularité
#
TrumpDisclosesOver100MBTCETH
3,83M Popularité

Épinglé

La réalité des entreprises après la marée descendante de la frénésie des tokens : le contrôle budgétaire devient la nouvelle norme, mais le train de l'IA ne ralentit pas.

Les histoires à la une sont exagérées, les données réelles sont plus douces

La gestion budgétaire devient la nouvelle norme, mais les standards sont très variables

Les règles de survie des employés pour « économiser les tokens »

La demande de tokens bon marché continue de croître, le marché des endpoints TaaS/API ne refroidit pas

Le codage reste la demande la plus forte, le train de l'IA ne ralentit pas à cause des limites budgétaires

Le véritable ROI de l'IA : gains d'efficacité, mais les attentes de production augmentent également

Sujets populaires

GateCompletesDividendDistribution

StrategyBuybackSurges12%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

TrumpDisclosesOver100MBTCETH

Épinglé