Guang Fa Securities: GTC Nvidia upgrade Agent computing power products, domestic AI industry ushers in new opportunities

robot
Geração de resumo em curso

Fazer trading de ações só com relatórios de analistas do Golden Kylin, confiáveis, profissionais, oportunos e abrangentes, para ajudá-lo a identificar oportunidades de temas com potencial!

(Fonte: Zhitong Caijing)

O aplicativo Zhitong Caijing soube que a Guotai Junan Securities publicou um relatório de pesquisa afirmando que, na conferência GTC, a Nvidia (NVDA.US) apresentou vários novos produtos de capacidade de IA, com foco em fortalecer a competitividade na linha de produtos de capacidade de cálculo para agentes em clusters e inferência. O impulso dos agentes na demanda por capacidade de inferência está crescendo rapidamente, e o processo de substituição de chips de IA nacionais por estrangeiros pode acelerar, com potencial para abrir espaço adicional a longo prazo. Além disso, o software básico de IA também se beneficia da implementação e expansão de aplicações relacionadas a agentes.

Os principais pontos da Guotai Junan são os seguintes:

Na conferência GTC, a Nvidia apresentou vários novos produtos de capacidade de IA voltados para aplicações de agentes

Em 16 de março de 2026, na conferência GTC, a Nvidia exibiu diversos produtos de capacidade de IA, incluindo o supernó NVL72 Vera Rubin, o Groq 3 LPU e LPX, além do NemoClaw. Com base na direção de seus lançamentos, a Nvidia está focada em fortalecer sua competitividade na linha de produtos de capacidade de cálculo para agentes em clusters e inferência.

Especificamente:

① Em comparação com os produtos de supernó com arquitetura Blackwell, o Vera Rubin NVL72 melhorou em 5 vezes o desempenho de inferência e em 3,5 vezes o desempenho de treinamento. A melhoria na capacidade de cluster da arquitetura Vera Rubin deve atender melhor às necessidades de fabricantes de tecnologia por acelerar modelos de IA com trilhões de parâmetros, grandes modelos multimodais e tarefas de inferência de agentes. ② Para cenários de inferência de agentes que frequentemente requerem longos contextos e baixa latência, a Nvidia lançou o chip dedicado Groq 3LPU. Este chip, que integra princípios de modelos e algoritmos de agentes, apresenta melhorias claras no desempenho de cálculo, refletindo uma tendência de fusão mais evidente entre hardware e algoritmos. ③ Para cenários de múltiplos agentes colaborativos, a pilha de software Dynamo melhora o desempenho por meio de otimizações de armazenamento KV-Cache, roteamento dinâmico de grandes modelos de linguagem e técnicas de inferência passo a passo. ④ A pilha de software de aceleração vetorial cuVS aumenta a eficiência ao acelerar processos de busca e recuperação vetorial, apoiando cenários de mineração de dados e busca semântica. ⑤ O NemoClaw usa o kit de ferramentas de agentes da Nvidia para otimizar aplicações típicas do OpenClaw; o lançamento do NemoClaw confirma a visão de que “o camarão pode transformar a arquitetura, canais e operações de futuros softwares, tornando-se uma disputa de entrada”.

O impulso dos agentes na demanda por capacidade de inferência está crescendo rapidamente, e o espaço para substituição de chips de IA nacionais se abre

Na conferência GTC, a Nvidia não apenas reforçou o desempenho de capacidade de cálculo relacionada a agentes em hardware, como chips e supernós, mas também adaptou aplicações de agentes por meio de pilhas de software como Dynamo e NemoClaw. Isso reflete uma tendência de aumento rápido na demanda por capacidade de inferência impulsionada por agentes no futuro. Por um lado, devido às políticas, as vendas de chips de IA da Nvidia, incluindo Vera Rubin, ainda enfrentam grande incerteza no mercado doméstico; por outro lado, como os chips de IA para inferência exigem menor desempenho, os chips de IA nacionais têm menor dificuldade técnica para acompanhar os chips estrangeiros, liderados pela Nvidia. Com essa tendência, o processo de substituição de chips de IA nacionais deve acelerar, com potencial para abrir espaço adicional a longo prazo. Além disso, o software básico de IA também se beneficia da implementação e expansão de aplicações relacionadas a agentes.

Recomendações de atenção:

① Hardware de IA: Cambrian, Inspur, Unisoc. ② Modelos: Zhipu, MiniMax, Alibaba, Tencent, com foco em Sensetime e iFlytek. ③ Software básico de IA: Hologres, Zhuoyi, Paradigm. ④ Serviços de operação e gerenciamento de data centers: Wangsu, Baoxin Software, YunSaiZhiLian, com atenção à Capital Online.

Aviso de risco:

Risco de capacidade limitada de produção de chips de IA; o gap entre China e EUA na capacidade de IA se amplia, apresentando desafios para a recuperação da cadeia industrial doméstica; incertezas políticas podem afetar o fornecimento de chips de IA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar