Futures
Accédez à des centaines de contrats perpétuels
CFD
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Pre-IPOs
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Promotions
Centre d'activités
Participez et gagnez des récompenses
Parrainage
20 USDT
Invitez des amis et gagnez des récompenses
Programme d'affiliation
Obtenez des commissions exclusives
Gate Booster
Développez votre influence et gagnez des airdrops
Annoncement
Mises à jour en temps réel
Blog Gate
Articles sur le secteur de la crypto
AI
Gate AI
Votre assistant IA polyvalent pour toutes vos conversations
Gate AI Bot
Utilisez Gate AI directement dans votre application sociale
GateClaw
Gate Blue Lobster, prêt à l’emploi
Gate for AI Agent
Infrastructure IA, Gate MCP, Skills et CLI
Gate Skills Hub
+10K compétences
De la bureautique au trading, une bibliothèque de compétences tout-en-un pour exploiter pleinement l’IA
GateRouter
Choisissez intelligemment parmi plus de 40 modèles d’IA, avec 0 % de frais supplémentaires
黄仁勋 GTC 2026 揭示「Token 经济学」:运算即营收,Nvidia 全面量产启动 Vera Rubin 、台湾 AI 需求火箭飙升
Huang Renxun a dévoilé la nouvelle ère de « l’économie des tokens » lors du GTC Taipei 2026 : les centres de données AI passent de la vente de matériel à un modèle « calcul = revenu », chaque token étant une unité d’actif pouvant être tarifée et rentable. La structure Vera Rubin entre en production à grande échelle, associée au dé-couplage de l’inférence avec Groq LPU, permettant à un centre de données de 1 GW de voir son chiffre d’affaires annuel passer de 30 milliards de dollars à 300 milliards de dollars. Huang Renxun a également annoncé l’activation du siège NVIDIA Constellation à Taipei, avec une demande en calcul AI « en pleine explosion » à Taïwan.
(Précédent : Huang Renxun prêche « Hardness » à GTC 2026 ? Pourquoi l’Agent LLM doit être durci, une phrase dévoile le secret de la mise en œuvre de l’IA)
(Contexte supplémentaire : Point de vue » ChatGPT et Claude vont-ils éliminer tout travail ? »)
Table des matières de cet article
Basculer
Le PDG de NVIDIA, Huang Renxun, a lancé une déclaration choc lors du GTC Taipei 2026 le 1er juin : « Le token est un actif, le token est déjà une unité de revenu rentable. » Il a affirmé que la logique commerciale de l’industrie AI est en train de se transformer — passant de la vente de GPU hardware à celle de « résultats de calcul ».
Ce discours, donné au Taipei Music Center, en parallèle avec COMPUTEX 2026, a permis à Huang Renxun de revenir sur les annonces clés du GTC à San José, et d’illustrer par des données : un centre de données AI de 1 GW, après le passage de Blackwell à Vera Rubin avec l’architecture de dé-couplage de l’inférence de Groq, peut voir son chiffre d’affaires annuel passer d’environ 30 milliards de dollars à 300 milliards de dollars — une croissance « dix fois » qui a fait vibrer tous les partenaires de la chaîne d’approvisionnement.
Token = revenu : l’équation commerciale des usines AI
Huang Renxun a systématiquement décomposé la logique commerciale de « l’économie des tokens » dans son discours. Il a souligné que l’inférence AI a évolué de « répondre à des questions » à « générer du profit » — chaque token produit pouvant directement correspondre à la volonté de paiement du client final. NVIDIA a conçu cinq modèles de tarification pour les tokens :
« Chaque token peut générer des revenus, les entreprises AI voudront construire plus de tokens, en produire davantage, et créer plus d’usines AI. » Huang Renxun insiste sur le fait que c’est la raison pour laquelle la demande de calcul en Taiwan a « explosé » — lorsque le calcul équivaut directement à du revenu, l’expansion des centres de données devient une nécessité.
Vera Rubin en production massive : la chaîne d’approvisionnement doublée
En tant que lancement matériel le plus attendu du GTC 2026, l’architecture Vera Rubin est désormais en production à grande échelle. Huang Renxun a révélé que la chaîne d’approvisionnement de Vera Rubin est deux fois plus grande que celle de la génération précédente, Grace Blackwell, avec plus de 150 partenaires taïwanais impliqués dans le monde entier.
Le rack phare Vera Rubin NVL72 intègre 72 GPU Rubin et 36 CPU Vera, utilisant une conception de refroidissement liquide à 100 %, permettant de déployer des modèles AI massifs dans un seul rack. Huang Renxun a également dévoilé pour la première fois la feuille de route de la nouvelle architecture Feynman, qui devrait pousser encore plus loin la performance en inférence et l’efficacité énergétique.
Il est à noter que Huang Renxun a laissé entendre à la fin de son discours qu’il y aurait encore des « surprises » en produits innovants au second semestre, ce qui a suscité de fortes attentes pour de nouveaux GPU grand public, puces pour véhicules, etc.
Dé-couplage de l’inférence : NVIDIA + Groq créent un « double moteur de tokens »
Huang Renxun a particulièrement évoqué la stratégie de collaboration avec Groq, pionnier des LPU (unités de traitement du langage). Contrairement aux GPU, excellents pour le calcul parallèle massif, les puces LPX de Groq, fabriquées par Samsung et prévues pour livraison au troisième trimestre, ciblent des scénarios où la « latence d’une seule requête » est critique — dans les tâches d’inférence en temps réel nécessitant une réponse en millisecondes, la performance des LPU Groq dépasse largement celle des GPU traditionnels.
Huang Renxun a utilisé une formule simple pour expliquer la puissance commerciale du « dé-couplage de l’inférence » :