En théorie, les coûts de l'IA auraient dû s'effondrer à l'heure qu'il est.


La même tâche de pointe qui coûtait 30 $ par million de tokens au lancement de GPT-4 en 2023 coûte aujourd'hui 1,25 $ avec GPT-5. Une baisse de 96× en trois ans, pour des modèles nommés avec des prix publiés.
Selon toute règle normale, les factures d'IA des entreprises devraient s'effondrer. Au lieu de cela, les budgets moyens d'IA du Fortune-500 sont passés de $7M en 2024 à $19M en 2026. Presque 3× en deux cycles budgétaires.
La raison : les tokens bon marché ne sont pas économisés, ils sont utilisés comme une arme. Un chatbot émet des tokens une fois puis s'arrête. Un agent qui effectue un vrai travail en utilise 5 à 30× plus pour la même tâche, et une fois que l'inférence est aussi bon marché, vous la dirigez vers tout. Chaque baisse de prix débloque plus d'utilisation qu'elle n'en économise.
Le centre de coûts n'a pas diminué. Il s'est déplacé de la couche modèle vers l'infrastructure sous-jacente. C'est là que la véritable facture s'écrit, et la plupart des entreprises ne l'ont pas encore ouverte.
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire