CITIC Securities: Focando na inflação da cadeia de computação, perspectiva otimista sobre a NVIDIA GTC para reforçar a confiança no crescimento contínuo da indústria de IA

robot
Geração de resumo em curso

A APP de notícias financeiras de Zhitong informa que a CITIC Securities publicou um relatório de pesquisa afirmando que a conferência GTC 2026 da Nvidia está próxima, e espera-se que a matriz de produtos de chips da empresa seja ampliada ainda mais. Além do conjunto completo de seis chips principais na plataforma Vera Rubin AI, há possibilidade de serem divulgados detalhes adicionais sobre o chip Rubin Ultra e mais informações sobre os gabinetes na conferência, trazendo inovações na arquitetura de design, como interconexão de dados e fornecimento de energia. A introdução de novos produtos como placas de circuito orthogonal e CPO deve aumentar a visibilidade de implementação. Focando na cadeia de poder computacional e na inflação, sob o cenário de demanda global por capacidade de cálculo acima do esperado, a prosperidade e os aumentos de preço na cadeia upstream devem continuar, tornando-se a principal linha de crescimento com maior certeza na configuração do setor de tecnologia atualmente. Acredita-se que a GTC 2026 reforçará ainda mais a confiança do mercado no crescimento contínuo da indústria de IA e na realização de lógica de incremento.

Principais pontos da CITIC Securities:

Destaque 1: Plataforma Rubin traz nova combinação de chips, refletindo design de colaboração extrema.

Na CES 2026, a Nvidia lançou o conjunto completo de seis chips principais na plataforma Vera Rubin AI: Rubin GPU, Vera CPU, BlueField-4 DPU, NVLink 6 Switch, ConnectX-9 SuperNIC, Spectrum-6 Ethernet Switch, incluindo todos os componentes principais dentro do gabinete. Todos os chips foram atualizados para o processo de 3nm da TSMC e equipados com HBM4, com capacidade e largura de banda de memória totalmente aprimoradas. Essa geração de produtos permite uma maior sinergia entre GPU, CPU e chips de interconexão, além de um design modular que torna a integridade do gabinete mais forte em comparação com a geração anterior Blackwell.

Destaque 2: Possível divulgação de mais detalhes sobre Rubin Ultra, aguardando inovações em interconexão de dados e arquitetura de fornecimento de energia.

Considerando que na CES 2026 a Nvidia confirmou que a plataforma Vera Rubin entrou na fase de produção em massa, a expectativa é que a GTC 2026 revele mais detalhes sobre os chips Rubin Ultra e os gabinetes. Além de o chip Rubin Ultra integrar quatro dies de cálculo para dobrar o desempenho em relação ao Rubin, há duas áreas principais de atenção na arquitetura:

  1. Interconexão de dados: aumento significativo na escala, com possível atualização do esquema de backplane de cabos de cobre para uma arquitetura de rede superposta de duas camadas (interconexão de placas de cálculo e de troca internas ao canister com PCB orthogonal) e interconexão óptica entre canisters. Novas tecnologias e materiais como RPCB de 78L, M9 CCL, eletrônica de vidro Q, CPO podem ser implementados.

  2. Sistema de fornecimento de energia: a energia e o consumo estão se tornando gargalos na expansão da capacidade de cálculo. Sistemas de fornecimento de alta tensão de 800V (HVDC) e soluções de fornecimento modular podem ser implementados, com melhorias em processos como PCB embutido e semicondutores de terceira geração GaN.

Destaque 3: Possível lançamento de novo chip de inferência LPU para reforçar a linha de produtos de inferência.

A Nvidia pode elevar a inferência de IA a uma infraestrutura de sistema fundamental, com uma solução de separação PD entre LPU e CPX para fortalecer a linha de produtos de inferência.

Para LPU: espera-se que na GTC a Nvidia apresente um novo chip de inferência que integre a tecnologia Groq LPU, com arquitetura personalizada para inferência de LLM, redesenho do processador de fluxo tensorial (TSP) usando SRAM como memória on-chip, aumentando significativamente a velocidade de armazenamento e recuperação de dados, ideal para as altas demandas de largura de banda de memória na fase de decodificação.

Para CPX: o Rubin CPX lançado em 2025 pode reduzir custos na fase de pré-carregamento, possivelmente usando GDDR7 ou HBM3E como memória principal. Segundo a SemiAnalysis, o produto pode evoluir de uma configuração integrada ao tray de computação Rubin para uma solução em gabinete independente, compatível com NVL72 VR200. Informações da cadeia indicam que o LPU também pode ser lançado em gabinetes independentes de 256 placas LPX.

Destaque 4: Perspectivas para a próxima geração da arquitetura Feynman.

A tendência de design da próxima geração da arquitetura Feynman da Nvidia tem recebido atenção crescente na indústria, e a GTC 2026 pode apresentar novidades nesse aspecto. Com base em informações atuais, a Trendforce prevê que a Feynman será uma das primeiras a usar o processo A16 da TSMC, com potencial uso de fornecimento de energia por trás (Backside Power Delivery) para liberar espaço de roteamento, além de possivelmente incorporar tecnologia de empilhamento 3D para integrar o hardware LPU do Groq.

A produção pode começar em 2028, com entregas aos clientes a partir de 2029. Detalhes específicos da arquitetura Feynman ainda não são claros, mas a compreensão da Nvidia sobre a direção de atualização da capacidade de cálculo de IA será crucial. Em um cenário de desaceleração de Moore, a inovação em capacidade, armazenamento e operação será fundamental para sustentar a evolução da indústria de IA, incluindo treinamento e inferência, além de refletir na visibilidade do retorno sobre investimento em IA. A Nvidia pode oferecer insights e surpresas na GTC, inspirando o setor.

Fatores de risco:

Risco geopolítico, desempenho abaixo do esperado de novos produtos de líderes de capacidade de cálculo no exterior, demanda de mercado de IA abaixo do esperado, aumento contínuo nos preços de componentes de armazenamento, riscos de inovação tecnológica e de produtos, regulamentação governamental e privacidade de dados, além de maior competição na indústria de PCB.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar