Huang Renxun a dévoilé la nouvelle ère de « l’économie des tokens » lors du GTC Taipei 2026 : les centres de données AI passent de la vente de matériel à un modèle « calcul = revenu », chaque token étant une unité d’actif pouvant être tarifée et rentable. La structure Vera Rubin entre en production à grande échelle, associée au dé-couplage de l’inférence avec Groq LPU, permettant à un centre de données de 1 GW de voir son chiffre d’affaires annuel passer de 30 milliards de dollars à 300 milliards de dollars. Huang Renxun a également annoncé l’activation du siège NVIDIA Constellation à Taipei, avec une demande en calcul AI « en pleine explosion » à Taïwan.
(Précédent : Huang Renxun prêche « Hardness » à GTC 2026 ? Pourquoi l’Agent LLM doit être durci, une phrase dévoile le secret de la mise en œuvre de l’IA)
(Contexte supplémentaire : Point de vue » ChatGPT et Claude vont-ils éliminer tout travail ? »)

Table des matières de cet article

Basculer

Token = revenu : l’équation commerciale des usines AI
Vera Rubin en production massive : la chaîne d’approvisionnement doublée
Dé-couplage de l’inférence : NVIDIA + Groq créent un « double moteur de tokens »

Le PDG de NVIDIA, Huang Renxun, a lancé une déclaration choc lors du GTC Taipei 2026 le 1er juin : « Le token est un actif, le token est déjà une unité de revenu rentable. » Il a affirmé que la logique commerciale de l’industrie AI est en train de se transformer — passant de la vente de GPU hardware à celle de « résultats de calcul ».

Ce discours, donné au Taipei Music Center, en parallèle avec COMPUTEX 2026, a permis à Huang Renxun de revenir sur les annonces clés du GTC à San José, et d’illustrer par des données : un centre de données AI de 1 GW, après le passage de Blackwell à Vera Rubin avec l’architecture de dé-couplage de l’inférence de Groq, peut voir son chiffre d’affaires annuel passer d’environ 30 milliards de dollars à 300 milliards de dollars — une croissance « dix fois » qui a fait vibrer tous les partenaires de la chaîne d’approvisionnement.

Token = revenu : l’équation commerciale des usines AI

Huang Renxun a systématiquement décomposé la logique commerciale de « l’économie des tokens » dans son discours. Il a souligné que l’inférence AI a évolué de « répondre à des questions » à « générer du profit » — chaque token produit pouvant directement correspondre à la volonté de paiement du client final. NVIDIA a conçu cinq modèles de tarification pour les tokens :

Niveau gratuit : questions de base, service client
Léger (environ 5 dollars par million de tokens) : génération de contenu, résumés
Professionnel (environ 30 dollars par million de tokens) : génération de code, analyse de données
Entreprise (environ 80 dollars par million de tokens) : conformité réglementaire, modélisation financière
Premium (environ 150 dollars par million de tokens) : recherche scientifique, découverte de médicaments, inférence en temps réel

« Chaque token peut générer des revenus, les entreprises AI voudront construire plus de tokens, en produire davantage, et créer plus d’usines AI. » Huang Renxun insiste sur le fait que c’est la raison pour laquelle la demande de calcul en Taiwan a « explosé » — lorsque le calcul équivaut directement à du revenu, l’expansion des centres de données devient une nécessité.

Vera Rubin en production massive : la chaîne d’approvisionnement doublée

En tant que lancement matériel le plus attendu du GTC 2026, l’architecture Vera Rubin est désormais en production à grande échelle. Huang Renxun a révélé que la chaîne d’approvisionnement de Vera Rubin est deux fois plus grande que celle de la génération précédente, Grace Blackwell, avec plus de 150 partenaires taïwanais impliqués dans le monde entier.

Le rack phare Vera Rubin NVL72 intègre 72 GPU Rubin et 36 CPU Vera, utilisant une conception de refroidissement liquide à 100 %, permettant de déployer des modèles AI massifs dans un seul rack. Huang Renxun a également dévoilé pour la première fois la feuille de route de la nouvelle architecture Feynman, qui devrait pousser encore plus loin la performance en inférence et l’efficacité énergétique.

Il est à noter que Huang Renxun a laissé entendre à la fin de son discours qu’il y aurait encore des « surprises » en produits innovants au second semestre, ce qui a suscité de fortes attentes pour de nouveaux GPU grand public, puces pour véhicules, etc.

Dé-couplage de l’inférence : NVIDIA + Groq créent un « double moteur de tokens »

Huang Renxun a particulièrement évoqué la stratégie de collaboration avec Groq, pionnier des LPU (unités de traitement du langage). Contrairement aux GPU, excellents pour le calcul parallèle massif, les puces LPX de Groq, fabriquées par Samsung et prévues pour livraison au troisième trimestre, ciblent des scénarios où la « latence d’une seule requête » est critique — dans les tâches d’inférence en temps réel nécessitant une réponse en millisecondes, la performance des LPU Groq dépasse largement celle des GPU traditionnels.

Huang Renxun a utilisé une formule simple pour expliquer la puissance commerciale du « dé-couplage de l’inférence » :

Génération Blackwell : un centre de 1 GW génère environ 30 milliards de dollars de revenus annuels
Génération Vera Rubin : sous la même consommation d’énergie, le chiffre d’affaires peut atteindre 150 milliards de dollars (5 fois plus)
Vera Rubin + Groq dé-couplage de l’inférence : chiffre d’affaires annuel pouvant atteindre 300 milliards de dollars (10 fois plus)

Les centres de données passent de lieux d’entraînement de modèles à des usines de production de tokens.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
IntroducingGateStocks
37.28K Popularité
#
WinGoldBarsWithGrowthPoints
1.25M Popularité
#
IsraelStrikesIranBTCPlunges
51.79K Popularité
#
ArthurHayesSeesHYPEOvertakingSOL
18.19M Popularité
#
USIranNegotiationGame
9.57M Popularité

Épinglé

黄仁勋 GTC 2026 揭示「Token 经济学」：运算即营收，Nvidia 全面量产启动 Vera Rubin 、台湾 AI 需求火箭飙升

Token = revenu : l’équation commerciale des usines AI

Vera Rubin en production massive : la chaîne d’approvisionnement doublée

Dé-couplage de l’inférence : NVIDIA + Groq créent un « double moteur de tokens »

Sujets populaires

IntroducingGateStocks

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

ArthurHayesSeesHYPEOvertakingSOL

USIranNegotiationGame

Épinglé