仁勳在 GTC Taipei 2026 揭示「Token 经济学」新时代:AI 数据中心正从硬件销售转向「计算即营收」模式,每个 Token 都是可定价、可获利的资产单位。Vera Rubin 架构全面量产,搭配 Groq LPU 解耦推理,让 1GW 数据中心年营收从 300 亿美元飙升至 3,000 亿美元。仁勳更宣布 NVIDIA Constellation 台北总部启用,台湾 AI 计算需求「火箭式飙升」。 (前情提要:仁勳 GTC 2026 疯讲「Hardness」? LLM Agent 为什么要硬化,一句话道破 AI 代理落地的关键) (背景补充:观点》ChatGPT 和 Claude 会把一切工作赶尽杀绝吗?)
本文目录
切换
NVIDIA 执行长仁勳 6 月 1 日在 GTC Taipei 2026 大会上投掷重磅宣言:**「Token 就是资产,Token 已经成为获利的营收单位。」**他直言,AI 产业的商业逻辑正在翻转——从卖 GPU 硬件,走向卖「运算产出」的时代。
这场在台北流行音乐中心举行的主题演讲,与 COMPUTEX 2026 同步登场,仁勳不仅回顾了 GTC 圣荷西主场的关键发布,更进一步用资料论证:一个 1GW 规模的 AI 数据中心,从 Blackwell 换代到 Vera Rubin 加 Groq 解耦推理架构后,年营收可从约 300 亿美元直接跳升到 3,000 亿美元——「十倍增长」的商业故事,让全场供应链伙伴沸腾。
仁勳在演讲中系统性拆解了「Token 经济学」的商业逻辑。他指出,AI 推理已经从「回答问题」进化为「制造利润」——每一个 Token 产出都可能直接对应到终端客户的付费意愿。NVIDIA 为此设计了五档 Token 定价模型:
「每一个 Token 都能赚钱,AI 公司会想要建造更多 Token,生成更多 Token,生产更多 AI 工厂。」仁勳强调,这正是为什么台湾的运算需求已经「火箭式飙升」——当运算直接等于营收,扩建数据中心就成为必然。
作为 GTC 2026 最受瞩目的硬件发布,Vera Rubin 架构已正式进入全面量产。仁勳透露,Vera Rubin 的供应链规模是前代 Grace Blackwell 的两倍,全球有超过 150 家台湾供应链伙伴参与其中。
旗舰级 Vera Rubin NVL72 机柜整合了 72 颗 Rubin GPU 与 36 颗 Vera CPU,采用 100% 液冷散热设计,单一机柜即可部署超大规模 AI 模型。仁勳也首次公开了下一代 Feynman 架构路线图,预计将进一步推动推理性能与能源效率的极限。
值得注意的是,仁勳在演讲尾声暗示下半年还有「惊喜新产品」尚未公开,引发市场对消费级 GPU、车用芯片等新品的高度期待。
仁勳特别提及与 LPU(语言处理单元)先驱 Groq 的协同策略。不同于 GPU 擅长大量平行运算,Groq 3 LPX 晶片由三星代工、预计第三季出货,专攻「单一请求延迟最低」的场景——在需要毫秒级回应的即时推理任务中,Groq LPU 的表现远优于传统 GPU。
仁勳用一个简单公式解释「解耦推理」的商业威力:
数据中心正在从训练模型的地方,变成生产 Token 的工厂。
3450.39万 热度
125.23万 热度
1819.69万 热度
957.72万 热度
80.1万 热度
黄仁勋 GTC 2026揭示「Token 经济学」:运算即营收,Nvidia全面量产启动Vera Rubin 、台湾 AI 需求火箭飙升
仁勳在 GTC Taipei 2026 揭示「Token 经济学」新时代:AI 数据中心正从硬件销售转向「计算即营收」模式,每个 Token 都是可定价、可获利的资产单位。Vera Rubin 架构全面量产,搭配 Groq LPU 解耦推理,让 1GW 数据中心年营收从 300 亿美元飙升至 3,000 亿美元。仁勳更宣布 NVIDIA Constellation 台北总部启用,台湾 AI 计算需求「火箭式飙升」。
(前情提要:仁勳 GTC 2026 疯讲「Hardness」? LLM Agent 为什么要硬化,一句话道破 AI 代理落地的关键)
(背景补充:观点》ChatGPT 和 Claude 会把一切工作赶尽杀绝吗?)
本文目录
切换
NVIDIA 执行长仁勳 6 月 1 日在 GTC Taipei 2026 大会上投掷重磅宣言:**「Token 就是资产,Token 已经成为获利的营收单位。」**他直言,AI 产业的商业逻辑正在翻转——从卖 GPU 硬件,走向卖「运算产出」的时代。
这场在台北流行音乐中心举行的主题演讲,与 COMPUTEX 2026 同步登场,仁勳不仅回顾了 GTC 圣荷西主场的关键发布,更进一步用资料论证:一个 1GW 规模的 AI 数据中心,从 Blackwell 换代到 Vera Rubin 加 Groq 解耦推理架构后,年营收可从约 300 亿美元直接跳升到 3,000 亿美元——「十倍增长」的商业故事,让全场供应链伙伴沸腾。
Token 即营收:AI 工厂的商业方程式
仁勳在演讲中系统性拆解了「Token 经济学」的商业逻辑。他指出,AI 推理已经从「回答问题」进化为「制造利润」——每一个 Token 产出都可能直接对应到终端客户的付费意愿。NVIDIA 为此设计了五档 Token 定价模型:
「每一个 Token 都能赚钱,AI 公司会想要建造更多 Token,生成更多 Token,生产更多 AI 工厂。」仁勳强调,这正是为什么台湾的运算需求已经「火箭式飙升」——当运算直接等于营收,扩建数据中心就成为必然。
Vera Rubin 全面量产:供应链规模两倍起跳
作为 GTC 2026 最受瞩目的硬件发布,Vera Rubin 架构已正式进入全面量产。仁勳透露,Vera Rubin 的供应链规模是前代 Grace Blackwell 的两倍,全球有超过 150 家台湾供应链伙伴参与其中。
旗舰级 Vera Rubin NVL72 机柜整合了 72 颗 Rubin GPU 与 36 颗 Vera CPU,采用 100% 液冷散热设计,单一机柜即可部署超大规模 AI 模型。仁勳也首次公开了下一代 Feynman 架构路线图,预计将进一步推动推理性能与能源效率的极限。
值得注意的是,仁勳在演讲尾声暗示下半年还有「惊喜新产品」尚未公开,引发市场对消费级 GPU、车用芯片等新品的高度期待。
解耦推理:NVIDIA + Groq 打造「Token 双引擎」
仁勳特别提及与 LPU(语言处理单元)先驱 Groq 的协同策略。不同于 GPU 擅长大量平行运算,Groq 3 LPX 晶片由三星代工、预计第三季出货,专攻「单一请求延迟最低」的场景——在需要毫秒级回应的即时推理任务中,Groq LPU 的表现远优于传统 GPU。
仁勳用一个简单公式解释「解耦推理」的商业威力: