A solução de infraestrutura de IA mais poderosa de todos os tempos: a Nvidia lança a plataforma Vera Rubin, com o custo por token reduzido a 1/10

robot
Geração de resumo em curso

IT之家3月17日消息,今天(3月17日)在美国加州圣何塞举行的2026年GTC大会上,英伟达为推动智能体AI(Agentic AI)发展,发布Vera Rubin AI平台。

英伟达创始人兼首席执行官黄仁勋强调,Vera Rubin是一次代际飞跃,标志着其史上最大规模基础设施建设的开端,全面覆盖从大规模预训练到实时智能体推理的AI全生命周期。

此举标志着英伟达正式跨入传统CPU直销赛道,不仅直接与英特尔、AMD展开正面交锋,更向全球云计算巨头自研的Arm架构处理器发起挑战。

IT之家援引博文介绍,为大幅提升基础运算效率,Vera CPU单颗芯片配备88个核心与144个线程。该芯片采用英伟达深度定制的Arm v9.2-A Olympus核心,其指令级并行度(IPC)实现了惊人的1.5倍代际飞跃。

同时,该架构首发引入了“空间多线程”黑科技,通过物理隔离流水线组件,让多个线程真正在单核上同时运行,彻底告别了传统多线程技术资源排队造成的算力损耗。

在核心算力层面,新一代NVL72机架实现了效率的突破性提升。该机架通过NVLink6连接72块Rubin GPU与36块Vera CPU。

与上一代Blackwell平台相比,该系统仅需四分之一的GPU即可完成混合专家大模型(MoE)训练,同时每瓦推理吞吐量提升高达10倍,单Token成本降至十分之一。

此外,专为验证AI模型结果设计的Vera CPU机架集成了256块液冷CPU,其运行效率达到传统CPU的两倍,速度提升50%。

为应对智能体系统低延迟和长上下文的需求,英伟达推出了Groq3LPX推理加速机架。该系统包含256个LPU处理器,与Vera Rubin结合后,每兆瓦推理吞吐量飙升至最高35倍。

在数据存储方面,全新BlueField-4STX机架构建了AI原生存储基础架构。借助全新的DOCA Memos框架,该系统能够高效处理大型语言模型生成的海量键值(KV)缓存数据,在大幅降低能耗的同时,将推理吞吐量提升最高5倍,从而实现更快速的AI多轮交互。

英伟达GTC2026大会专题

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar