A solução de infraestrutura de IA mais poderosa de todos os tempos: a Nvidia lança a plataforma Vera Rubin, com o custo por token reduzido a 1/10

K-LinePoet · 2026-03-23T08:32:06+00:00

A NVIDIA lançou a plataforma Vera Rubin AI na conferência GTC de 2026, marcando uma nova fase na construção da sua infraestrutura, e competirá com fabricantes tradicionais de CPU e gigantes da computação em nuvem. A nova plataforma é equipada com arquitetura eficiente de CPU e GPU, melhorando significativamente a eficiência computacional e o desempenho do treino de modelos, enquanto introduz novos racks de aceleração de inferência e soluções de armazenamento para apoiar o desenvolvimento de IA de agentes.

K-LinePoet

2026-03-23 08:32:06

Geração de resumo em curso

IT之家3月17日消息，今天(3月17日)在美国加州圣何塞举行的2026年GTC大会上，英伟达为推动智能体AI(Agentic AI)发展，发布Vera Rubin AI平台。

英伟达创始人兼首席执行官黄仁勋强调，Vera Rubin是一次代际飞跃，标志着其史上最大规模基础设施建设的开端，全面覆盖从大规模预训练到实时智能体推理的AI全生命周期。

此举标志着英伟达正式跨入传统CPU直销赛道，不仅直接与英特尔、AMD展开正面交锋，更向全球云计算巨头自研的Arm架构处理器发起挑战。

IT之家援引博文介绍，为大幅提升基础运算效率，Vera CPU单颗芯片配备88个核心与144个线程。该芯片采用英伟达深度定制的Arm v9.2-A Olympus核心，其指令级并行度(IPC)实现了惊人的1.5倍代际飞跃。

同时，该架构首发引入了“空间多线程”黑科技，通过物理隔离流水线组件，让多个线程真正在单核上同时运行，彻底告别了传统多线程技术资源排队造成的算力损耗。

在核心算力层面，新一代NVL72机架实现了效率的突破性提升。该机架通过NVLink6连接72块Rubin GPU与36块Vera CPU。

与上一代Blackwell平台相比，该系统仅需四分之一的GPU即可完成混合专家大模型(MoE)训练，同时每瓦推理吞吐量提升高达10倍，单Token成本降至十分之一。

此外，专为验证AI模型结果设计的Vera CPU机架集成了256块液冷CPU，其运行效率达到传统CPU的两倍，速度提升50%。

为应对智能体系统低延迟和长上下文的需求，英伟达推出了Groq3LPX推理加速机架。该系统包含256个LPU处理器，与Vera Rubin结合后，每兆瓦推理吞吐量飙升至最高35倍。

在数据存储方面，全新BlueField-4STX机架构建了AI原生存储基础架构。借助全新的DOCA Memos框架，该系统能够高效处理大型语言模型生成的海量键值(KV)缓存数据，在大幅降低能耗的同时，将推理吞吐量提升最高5倍，从而实现更快速的AI多轮交互。

英伟达GTC2026大会专题

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.