À l'époque de la révolution industrielle, plus le charbon était bon marché, plus tout le monde le brûlait. Maintenant, l'ère de l'IA, c'est pareil avec les jetons


Les jetons deviennent bon marché, les produits IA peuvent brûler encore plus
Avant, tu posais une question, le modèle répondait, et c'était fini
Maintenant, tu cliques, l'Agent décompose la tâche en arrière-plan, recherche des informations, ajuste des outils, écrit du code, corrige des erreurs, résume, et exécute tout un processus
Donc, un seul jeton est moins cher, mais une tâche unique consomme beaucoup plus de jetons
C'est la raison pour laquelle la facture continue d'augmenter
Après que la machine à vapeur ait permis d'économiser du charbon, le Royaume-Uni n'a pas moins brûlé de charbon. Parce que le charbon est devenu plus rentable, plus de machines, d'usines, de chemins de fer ont commencé à brûler du charbon
Les jetons suivent cette logique aussi
Une fois bon marché, les Agents, la Recherche Profonde, la programmation IA, le contexte long, l'automatisation d'entreprise commencent vraiment à décoller
Ainsi, le centre de coût de l'IA passe de la formation à l'inférence
La formation consomme de l'énergie pendant un moment, l'inférence, elle, consomme en continu. Quand l'utilisateur est en ligne, ça brûle. Quand l'Agent fonctionne, ça brûle. Plus le contexte est long, plus la mémoire cache est grande, et la consommation de mémoire, de bande passante, d'électricité, de refroidissement augmente
C'est aussi pourquoi la chaîne de valeur de l'IA ne peut pas se limiter aux GPU
HBM, DRAM, SSD, emballages avancés, modules optiques, puces d'échange, CPU, puces d'inférence, tous seront revalorisés par cette vague de demande d'inférence
Les entreprises d'applications IA seront également forcées de se stratifier
Les entreprises qui ne proposent qu'une interface, entièrement dépendantes d'API propriétaires, verront leur facture augmenter avec le nombre d'utilisateurs, et leur marge diminuer
Les véritables barrières vont descendre : routage, quantification, cache, traitement par lots, découpage de contexte, substitution de grands modèles par de petits modèles
Hum, le jeton, c'est le charbon
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler