Guangfa Securities: A Nvidia (NVDA.US) Nova Platform Reforça a Competitividade das Aplicações de Agentes; a Inferência de IA Impulsiona o Ciclo de Armazenamento Contínuo para Cima

robot
Geração de resumo em curso

A GF Securities publicou um relatório de pesquisa afirmando que a Nvidia (NVDA.US) apresentou Vera RubinPOD na GTC, com foco em fortalecer a competitividade das aplicações de Agent em produtos de computação em cluster e inferência. Com o avanço da IA, inovação de modelos e CAPEX como base, o desenvolvimento coordenado da cadeia de indústria de IA continua; a inferência de IA impulsiona a melhoria contínua do ciclo de armazenamento, com expansão e atualização simultâneas. Recomenda-se atenção às ações beneficiadas na cadeia de indústria.

Principais pontos da GF Securities:

Nvidia lança plataforma Vera RubinPOD

De acordo com o site oficial da Nvidia, em 16 de março de 2026, a Nvidia apresentou na GTC o Vera RubinPOD, composto por cinco novos sistemas de rack especialmente projetados para cargas de trabalho de IA Agentic. Como cargas de trabalho Agentic exigem alta taxa de transferência, latência extremamente baixa, inferência de alta densidade, sandbox de CPU intensivo e grande memória de contexto, a Nvidia reforçou sua competitividade na linha de produtos de computação em cluster e inferência para aplicações de Agent. O Vera RubinPOD é dividido principalmente em dois tipos de rack: (1) Rack MGXNVL: Vera Rubin NVL72, interligado internamente por NVLink, responsável pelas tarefas principais de GPU; (2) Rack MGXETL: incluindo rack Groq3 LPX, rack Vera CPU, armazenamento BlueField-4 STX e rede Spectrum-6 SPX, todos interligados por SpectrumX Ethernet ou chips Groq3 LPU para colaboração. Segundo o diagrama do site oficial, um Vera Rubin 1152 SuperPOD consiste em 16 racks Vera Rubin NVL72, 2 racks Vera CPU, 10 racks Groq3 LPX, 2 racks BlueField-4 STX e 10 racks Spectrum-6 SPX, formando uma arquitetura heterogênea de sistema colaborativo centrado em IA Agentic.

Rack Groq3 LPX para acelerar decoding

O rack Groq3 LPX integra 256 processadores LPU, equipado com 128 GB de SRAM on-chip e largura de banda de 640 TB/s. Na combinação de Vera Rubin NVL72 com LPX, a GPU é responsável principalmente pelo pré-preenchimento e cálculo de atenção na fase de decoding, enquanto o LPU acelera o computo FFN na fase de decoding, acelerando o processo de decodificação de cada token de saída por camada, colaborando com os racks Vera Rubin via interconexão Spectrum-X personalizada. Segundo a Nvidia, sob uma carga de 400 TPS por usuário, a combinação de Vera Rubin NVL72 com LPX oferece até 35 vezes mais TPS por megawatt em comparação com a Nvidia GB200 NVL72, aumentando a produção do sistema e adaptando-se melhor a cenários de IA Agent com baixa latência e forte interatividade.

Rack Vera CPU para suporte ao ambiente sandbox RL/Agent

O rack Vera CPU integra 256 CPUs Vera, com design de resfriamento líquido de alta densidade, suportando mais de 22.500 ambientes de sandbox de aprendizado reforçado (RL) ou agentes, utilizados para testar, executar e validar os resultados de Vera Rubin NVL72 e LPX.

Aviso de risco

Desenvolvimento da indústria de IA e demanda abaixo do esperado; volume de envio de servidores de IA abaixo do esperado; progresso tecnológico e de produtos de fabricantes nacionais abaixo do esperado.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar