黄仁勋在 GTC Taipei 2026 主题演讲中宣布两大重磅讯息:针对 Agentic AI 时代打造的 Vera Rubin CPU 正式亮相,以及首款与联发科合作设计、整合 CPU、GPU 与 NVLink 于单一晶圆上的 RTX SPARK 个人电脑平台,象征 PC 架构正式跨入服务器级 AI 计算时代。
(前情提要:黄仁勋 GTC 2026揭示「Token 经济学」:运算即营收,Nvidia全面量产启动Vera Rubin 、台湾 AI 需求火箭飙升)
(背景补充:黄仁勋 GTC 2026 狂讲「Hardness」? LLM Agent 为什么要硬化,一句话道破 AI 代理落地的关键)
本文目录
Toggle
Vera Rubin:史上第一款针对 Agentic AI 设计的 CPU
RTX SPARK:联发科联手,PC 架构 50 年来最大变革
Adobe 软件生态全面拥抱,MCP 服务器解锁 Agentic 工作流
重新定义个人电脑的时刻
黄仁勋在 GTC 2026 台北场的主题演讲中,为个人电脑的未来画下了清晰的路线图。从资料中心的 Vera Rubin 到桌面的 RTX SPARK,NVIDIA 正在将 AI 服务器等级的架构带入个人运算领域,而这一切的起点,是一颗专为 AI 代理人(AI Agent)设计的 CPU。
Vera Rubin:史上第一款针对 Agentic AI 设计的 CPU
Vera 是 NVIDIA 史上第一款从零开始为 AI 代理人时代设计的 CPU。与传统 x86 服务器处理器相比,Vera 的最大差异在于其对「带宽」与「延迟」的极致优化,这正是 AI 代理人工作流的两大瓶颈。
在硬件规格上,Vera CPU 支持 PCIe Gen 6 接口,提供高达 1.4 TB/s 的资料吞吐量;记忆体方面采用 LPDDR5X ECC,频宽约 1.2 TB/s,确保 AI 代理人在处理大规模即时推理任务时不会因资料搬运延迟而卡顿。黄仁勋在演讲中特别强调,Vera 在各项 AI 工作负载的端对端延迟表现上,远胜于同级 x86 服务器。
Vera Rubin AI 工厂并非单一产品,而是一套包含 7 款晶片、5 种机柜规格的完整平台。其中最受瞩目的是 NVL72 机柜,整合 72 顆 Rubin GPU 与 36 顆 Vera CPU,专为超大规模 Agentic AI 推理设计。此外,NVIDIA 也在该平台中整合了去年以 20 亿美元收购的 Groq LPU(语言处理单元),打造专门处理 AI 代理人结构化输出的专用硬体层,让代理人的「思考」与「行动」都有专属硬体加速。
黄仁勋GTC 2026重新定义PC:Vera Rubin 成首款 Agentic CPU,Nvidia 联手联发科推出 RTX SPARK 笔电革命
黄仁勋在 GTC Taipei 2026 主题演讲中宣布两大重磅讯息:针对 Agentic AI 时代打造的 Vera Rubin CPU 正式亮相,以及首款与联发科合作设计、整合 CPU、GPU 与 NVLink 于单一晶圆上的 RTX SPARK 个人电脑平台,象征 PC 架构正式跨入服务器级 AI 计算时代。
(前情提要:黄仁勋 GTC 2026揭示「Token 经济学」:运算即营收,Nvidia全面量产启动Vera Rubin 、台湾 AI 需求火箭飙升)
(背景补充:黄仁勋 GTC 2026 狂讲「Hardness」? LLM Agent 为什么要硬化,一句话道破 AI 代理落地的关键)
本文目录
Toggle
黄仁勋在 GTC 2026 台北场的主题演讲中,为个人电脑的未来画下了清晰的路线图。从资料中心的 Vera Rubin 到桌面的 RTX SPARK,NVIDIA 正在将 AI 服务器等级的架构带入个人运算领域,而这一切的起点,是一颗专为 AI 代理人(AI Agent)设计的 CPU。
Vera Rubin:史上第一款针对 Agentic AI 设计的 CPU
Vera 是 NVIDIA 史上第一款从零开始为 AI 代理人时代设计的 CPU。与传统 x86 服务器处理器相比,Vera 的最大差异在于其对「带宽」与「延迟」的极致优化,这正是 AI 代理人工作流的两大瓶颈。
在硬件规格上,Vera CPU 支持 PCIe Gen 6 接口,提供高达 1.4 TB/s 的资料吞吐量;记忆体方面采用 LPDDR5X ECC,频宽约 1.2 TB/s,确保 AI 代理人在处理大规模即时推理任务时不会因资料搬运延迟而卡顿。黄仁勋在演讲中特别强调,Vera 在各项 AI 工作负载的端对端延迟表现上,远胜于同级 x86 服务器。
Vera Rubin AI 工厂并非单一产品,而是一套包含 7 款晶片、5 种机柜规格的完整平台。其中最受瞩目的是 NVL72 机柜,整合 72 顆 Rubin GPU 与 36 顆 Vera CPU,专为超大规模 Agentic AI 推理设计。此外,NVIDIA 也在该平台中整合了去年以 20 亿美元收购的 Groq LPU(语言处理单元),打造专门处理 AI 代理人结构化输出的专用硬体层,让代理人的「思考」与「行动」都有专属硬体加速。
RTX SPARK:联发科联手,PC 架构 50 年来最大变革
如果说 Vera Rubin 定义了资料中心的 Agentic 未来,那么 RTX SPARK 就是将这个未来直接放上你桌面的钥匙。这是 NVIDIA 史上第一款笔电级系统单晶片(SoC),采用台积电 3 纳米制程,晶体管数量高达 700 亿颗。
RTX SPARK 的核心架构整合了三大关键元件:由联发科共同设计的 20 核心 Grace CPU、6,144 核 CUDA 核心的 Blackwell 世代 GPU,以及 128GB 统一记忆体。最革命性的设计在于 NVLink C2C 互连技术,这是一条高达 600 GB/s 的晶片内互连通道,频宽是传统 PCIe Gen 5 的五倍,让 CPU 与 GPU 之间的数据传输几乎零延迟。
「这是个人电脑史上首次,CPU、GPU 与高速互连全部封装在同一块晶圆上。」黄仁勋在演讲中表示。过去只有 OpenAI 这类顶尖 AI 实验室才能在服务器机房中享有的架构,如今被浓缩排入一台笔记型电脑大小的装置中。RTX SPARK 的 FP4 AI 算力达到 1 petaFLOP,这在过去是需要一整柜 GPU 服务器才能达到的性能水准。
Adobe 软件生态全面拥抱,MCP 服务器解锁 Agentic 工作流
RTX SPARK 不只是硬体规格的堆叠,软件生态的配合同样关键。黄仁勋在演讲中宣布,Adobe 已针对 RTX SPARK 平台重新改写 Photoshop 与 Premiere Pro 的核心渲染引擎,效能提升最高可达两倍。
更值得注意的是,Adobe 同时发布了 MCP(Model Context Protocol)服务器,让 AI 代理人可以直接操控 Photoshop 与 Premiere 的内部功能,从自动修图、批次调色到影片剪辑流程自动化,全部可透过自然语言指令完成。这正是黄仁勋在 GTC 2026 反复强调的「Agentic AI」愿景的具体落地:硬体(RTX SPARK)提供足够的本机 AI 算力,软体(Adobe MCP)则让 AI 代理人真正「长出手脚」。
重新定义个人电脑的时刻
从 1981 年 IBM PC 确立 x86 架构标准以来,个人电脑的核心设计逻辑几乎没有本质性的改变,CPU 负责通用运算,GPU 负责图形渲染,两者透过低速汇流排沟通。GTC 2026 的两项重大发表,正在改写这套沿用近半世纪的公式。
Vera Rubin 证明了针对特定 AI 工作负载重新设计 CPU 架构的价值:不是更快一点的 x86,而是完全不同的运算范式。RTX SPARK 则将服务器级的 CPU-GPU 统一记忆体架构带入消费市场,让个人电脑从「生产力工具」进化为「AI 代理人主机」。
背后支撑这场革命的,是 NVIDIA 在台湾建立的庞大供应链网络,超过 150 家台湾协力厂商,从台积电 3 纳米 CoWoS-R/L 先进封装,到鸿海、广达的系统整合制造,台湾再次站在个人电脑史上最重要范式转移的最前线。