Les tokens font fureur ! Comprendre la chaîne de l'industrie de l'économie des tokens en un seul article

“Les tokens sont de nouvelles matières premières.” Lors de la Conférence des développeurs GTC 2026, le fondateur et CEO de Nvidia, Jensen Huang, a présenté pour la première fois l’économie des tokens.

Jensen Huang a proposé une formule : revenus = nombre de tokens par watt × capacité en gigawatts disponible. Il a expliqué que les centres de données sont désormais devenus des “usines de tokens” fonctionnant en continu, entrant de l’électricité et des données, et sortant des tokens. Les revenus d’une “usine” dépendent du produit de l’efficacité et de l’échelle de production des tokens.

Le directeur de l’Administration nationale des données de Chine, Liu Liehong, a récemment déclaré qu’en mars de cette année, le volume quotidien d’appels de tokens en Chine avait déjà dépassé 140 billions, ce qui représente une augmentation de plus de 1000 fois par rapport aux 100 milliards du début 2024.

L’économie des tokens, une nouvelle chaîne de valeur, émerge.

Qu’est-ce que l’économie des tokens

Les tokens sont l’unité de base par laquelle les grands modèles traitent l’information. Lorsque les utilisateurs posent des questions à un modèle d’IA, le modèle découpe d’abord les mots de l’utilisateur en tokens, puis reconstitue la phrase avec les tokens résultants. Chaque token généré implique en réalité un appel à la puissance de calcul des GPU dans le centre de données, accompagné d’une consommation d’énergie.

Ainsi, les tokens sont naturellement une unité de mesure. Les API des fournisseurs de grands modèles facturent par token, et les fournisseurs de services cloud tarife leur puissance de calcul par token, tout comme les “degrés” pour l’électricité.

Cependant, pendant une longue période, les tokens n’étaient qu’un concept de coût. De 2023 à 2024, les différents modèles se sont mesurés en taille de paramètres et en volume de données d’entraînement, les tokens étant considérés comme un coût, personne ne les voyant comme un “produit”.

Le changement s’est produit lorsque l’IA est entrée dans la phase d’inférence. Au cours des deux dernières années, l’IA a été largement déployée dans des scénarios commerciaux, chaque interaction utilisateur et chaque exécution de tâche continuant à consommer des tokens. Dans le modèle de tarification, de nombreux fournisseurs d’IA facturent les utilisateurs par token ; plus ils consomment, plus ils peuvent vendre. À ce moment-là, les tokens sont devenus une marchandise pouvant être produite en masse, tarifée par niveaux et échangée à grande échelle.

Lors du GTC 2026, Jensen Huang a introduit l’économie des tokens, affirmant : “Les tokens sont de nouvelles matières premières.” Dans sa description, les centres de données fonctionnent comme des usines de tokens, avec des matières premières sous forme de données et d’électricité, et des produits sous forme de tokens.

Il a proposé un nouvel indicateur, “nombre de tokens par watt” (Tokens per Watt), qu’il considère comme un moyen d’évaluer la capacité de revenu des futurs centres de données. Cela s’explique par le fait que “dans un cadre de puissance fixe, celui qui a le plus grand débit de tokens par watt a le coût de production le plus bas.” Les itérations technologiques de Nvidia se concentrent également sur l’efficacité de production des tokens.

En résumé, l’essence de l’économie des tokens réside dans la mesure, la tarification et l’échange des résultats intelligents de l’IA, comme des produits industriels.

L’économie des tokens est en train de se développer. Le CEO d’OpenAI, Sam Altman, a déclaré lors d’un discours au début de cette année : “Fondamentalement, notre entreprise, ainsi que celle de chaque fournisseur de modèles d’IA, deviendra essentiellement la vente de tokens.”

Le directeur de l’Administration nationale des données de Chine, Liu Liehong, a récemment déclaré qu’en mars de cette année, le volume quotidien d’appels de tokens en Chine avait déjà dépassé 140 billions, ce qui représente une augmentation de plus de 1000 fois par rapport aux 100 milliards du début 2024, et a augmenté de plus de 40% par rapport aux 100 billions de fin 2025 en seulement trois mois.

Liu Liehong estime que les tokens ne sont pas seulement un point d’ancrage de valeur à l’ère intelligente, mais aussi une “unité de règlement” qui relie l’offre technologique à la demande commerciale, offrant une possibilité quantifiable pour la mise en œuvre de modèles commerciaux.

La chaîne de valeur des “usines de tokens”

“Une nouvelle révolution industrielle est en cours : ce qui entre dans l’usine (centre de données) est des données et de l’électricité, et ce qui en sort ce sont des tokens.” a déclaré Jensen Huang.

Une “usine de tokens”, tout comme une usine de fabrication, nécessite des bâtiments, des équipements, de la logistique, des ventes, etc. Selon cette logique et en tenant compte des rapports de plusieurs sociétés de courtage, l’économie des tokens peut être décomposée en quatre étapes.

#1

Étape de production

Secteurs concernés : puces AI et serveurs, infrastructure AIDC (centre de données d’intelligence artificielle), refroidissement liquide, systèmes d’alimentation.

Le processus de production des tokens est en fait le processus d’inférence, transformant l’électricité et les données en tokens. Ce qui détermine la limite de capacité de ce centre de données, ce sont son matériel physique, y compris la salle de serveurs AIDC, les puces AI et les serveurs, les systèmes de refroidissement liquide et les installations d’alimentation. Ensemble, ils déterminent l’efficacité d’utilisation de la puissance, c’est-à-dire combien de tokens peuvent être générés par watt d’électricité.

Jensen Huang a mentionné : “Une usine de 1 gigawatt ne deviendra jamais 2 gigawatts, c’est une loi physique.” Cela signifie que la concurrence dans l’étape de production est essentiellement une question d’efficacité ; pour une même quantité d’énergie, celui qui peut produire plus de tokens aura un avantage plus grand.

#2

Étape d’optimisation

Secteurs concernés : algorithmes d’optimisation de l’inférence, systèmes de planification, modules optiques, etc.

Une fois le centre de données construit, la puissance totale est fixe. Dans un cadre matériel inchangé, le moyen essentiel d’augmenter les revenus est de faire en sorte que chaque watt d’électricité produise plus de tokens facturables.

Jensen Huang a évoqué lors du GTC 2026 un exemple : Fireworks AI et Lynn, deux entreprises qui, sans changer aucun matériel, ont amélioré la vitesse de génération des tokens de près de 5000 tokens par seconde grâce à la mise à jour de la pile logicielle et des algorithmes d’inférence de Nvidia. Cela signifie que des techniques comme les algorithmes de planification et d’optimisation de l’inférence peuvent considérablement augmenter la production de l’usine sans ajouter de matériel.

#3

Étape de circulation

Secteurs concernés : CDN (réseaux de distribution de contenu), réseaux privés transfrontaliers, câbles sous-marins.

Une fois les tokens produits, ils doivent être livrés aux utilisateurs finaux avec une latence extrêmement faible. Contrairement aux biens matériels, la production et la livraison des tokens se produisent souvent simultanément.

Les nœuds de périphérie du CDN jouent le rôle de “dernier kilomètre” de distribution, et lorsque les tokens doivent être livrés à l’international, les réseaux privés transfrontaliers et les câbles sous-marins constituent le canal logistique international.

“L’exportation de tokens” se produit également à cette étape. Les modèles nationaux, grâce à un avantage significatif en termes de coûts d’inférence, exportent en masse des tokens via des plateformes API à l’étranger, soutenant ainsi l’infrastructure de réseau pour les flux transfrontaliers, formant ainsi un pipeline de base pour l’exportation.

#4

Étape d’application

Secteurs concernés : fournisseurs de grands modèles, applications d’agent, SaaS pour secteurs verticaux, plateformes de génération multimodale.

L’étape d’application est également le stade de réalisation de la valeur finale de l’économie des tokens. Jensen Huang a prédit lors du GTC 2026 que chaque entreprise SaaS deviendrait une entreprise d’agent-en-tant-que-service, et chaque ingénieur disposerait d’un budget annuel de tokens.

Avec le déploiement continu des applications d’IA, les scénarios de consommation de tokens s’étendront bien au-delà de l’IA conversationnelle actuelle, vers des agents, la génération de contenu multimodal, l’analyse financière, et bien d’autres domaines. Plus la consommation est importante, plus cela stimule la demande d’expansion dans les étapes de production en amont, créant un cycle positif qui est également le moteur sous-jacent du fonctionnement continu de toute la chaîne de valeur.

Focaliser sur les investissements en infrastructures de calcul et autres directions

Le rapport de Changcheng Securities estime qu’OpenClaw représente un nouveau point d’accélération puissant pour l’IA, et la vitesse de consommation des tokens va augmenter considérablement. Dans ce modèle, la consommation de tokens augmente parfois de plusieurs fois, voire des dizaines de fois.

Du point de vue des investissements, le développement rapide de l’économie des tokens bénéficie en premier lieu aux étapes de production des usines de tokens, y compris les puces AI, les centres de données, le refroidissement liquide, l’alimentation et autres infrastructures de calcul, direction actuellement la plus consensuelle parmi les institutions.

Le rapport de CITIC Securities indique que la consommation de tokens par ByteDance double environ tous les trois mois, et lorsque les grands fournisseurs de cloud nationaux atteignent 60 billions de tokens par jour, ils feront face à un manque évident de puissance de calcul. Il est donc prévu que lorsque la consommation quotidienne de tokens atteindra 30 billions, les grands fournisseurs de cloud nationaux ressentiront une tension en matière de puissance de calcul, et lorsque cela atteindra 60 billions de tokens, un certain manque de puissance de calcul commencera à apparaître.

Jiang Ying, analyste principal du secteur des communications chez Open Source Securities, estime que les tokens = puces AI (puissance nationale + location de puissance) = AIDC. Le rapport de Guojin Securities indique qu’en 2026, la chaîne de valeur de la puissance de calcul entrera dans un cycle d’“inflation de toute la chaîne”, la prospérité passant des puces aux AIDC, aux services cloud et aux équipements électriques.

De plus, la location de puissance de calcul et l’exportation de tokens sont également des directions qui bénéficient de l’essor de l’économie des tokens.

Changcheng Securities estime que l’exportation de tokens consiste essentiellement à fournir des services d’inférence via des interfaces API par des modèles d’IA locaux vers le monde entier, facturant en fonction du volume traité, réalisant ainsi l’“exportation numérique” de la puissance de calcul et de l’électricité. La raison pour laquelle les grands modèles chinois ont pu rapidement conquérir des parts de marché mondiales réside dans leur avantage clé en matière de contrôle des coûts, notamment dans le domaine de l’électricité.

Selon les calculs de l’équipe informatique de Shenwan Hongyuan, le coût d’inférence global des modèles d’IA nationaux est seulement d’un sixième à un dixième de celui des modèles étrangers.

“La chaîne de valeur des tokens est essentiellement une transformation qui convertit l’électricité du monde physique en intelligence dans le monde numérique,” estime Changcheng Securities, ajoutant que la logique de hausse des prix de cette chaîne suit le chemin “explosion de la demande à l’étranger → pénurie de matériel de stockage et de calcul → goulet d’étranglement énergétique/infrastructure → réévaluation des coûts de la chaîne entière.” Les énergies renouvelables et les transmissions à haute tension, qui possèdent un avantage de coût en amont, constituent une base de coût, verrouillant la limite inférieure des marges bénéficiaires ; la couche de puissance de calcul et de stockage intermédiaire constitue le goulet d’étranglement de la capacité d’approvisionnement ; les modèles et la couche de planification intermédiaire obtiennent un premium technologique grâce à l’optimisation des algorithmes ; tandis que les applications et la couche d’exportation en aval ouvrent un plafond de bénéfices grâce à une forte volonté de paiement mondiale.

Changcheng Securities estime qu’il convient de prêter attention à la priorisation des investissements, divisée en plusieurs étapes. La première étape consiste à se concentrer sur le stockage et la mémoire vidéo, pour profiter de la plus grande élasticité de hausse des prix due à un déséquilibre de l’offre et de la demande à court terme ; la deuxième étape concerne les puces de puissance de calcul et les serveurs, pour verrouiller les performances à moyen terme ; la troisième étape concerne les équipements électriques et les opérations d’énergies renouvelables, qui présentent des barrières à long terme ; la quatrième étape concerne les entreprises capables de réaliser des scénarios de mise en œuvre réels et ayant une capacité de monétisation élevée à l’étranger.

(Source : China Securities Journal)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler