A Nvidia entra no negócio de "criação de camarões" e aposta tudo na era de IA de inferência de bilião de dólares

robot
Geração de resumo em curso

Os gigantes globais de computação, como a NVIDIA, estão a transformar-se de fabricantes de chips em fábricas de IA, apostando nas oportunidades do mercado de inferência de inteligência artificial. No NVIDIA GTC 2026, que começou a 17 de março, o CEO Huang Renxun aumentou significativamente as previsões de receita para a nova geração de chips de IA, mirando um objetivo de 1 trilhão de dólares, e lançou oficialmente a próxima plataforma de hardware, além de produtos como uma pilha de software para “cultivo de camarões”.

Profissionais do setor comentam que um sinal forte do GTC deste ano é que a era da inferência está a acelerar. Além disso, a nova arquitetura de computação da NVIDIA liderará mudanças nos setores de dissipação de calor, materiais de embalagem e outros.

Apostando na inferência de IA

Na conferência, a NVIDIA destacou que, na nova fase de agentes de IA, a inferência se tornará o núcleo da competição por infraestrutura de IA, lançando oficialmente a próxima plataforma de computação Vera Rubin e o chip Groq3 LPU (Unidade de Processamento de Linguagem).

“Antes, ao falar de Hopper, mostrava um chip; agora, ao falar de Vera Rubin, as pessoas pensam no sistema completo.” Huang estimou que, nos últimos anos, a demanda de computação cresceu 1 milhão de vezes, e prevê que, entre 2025 e 2027, esse crescimento trará pelo menos 1 trilhão de dólares em receita para a empresa.

A plataforma Vera Rubin da NVIDIA, apresentada nesta ocasião, inclui 7 chips, 5 sistemas de rack e um supercomputador para IA baseada em agentes, incluindo a nova CPU Vera e a arquitetura de armazenamento Blue Field-4S TX. Comparada à geração anterior, a plataforma Blackwell, ela requer apenas um quarto do número de GPUs para treinar grandes modelos híbridos de especialistas, com um aumento de até 10 vezes na taxa de inferência por watt.

Na apresentação, Huang destacou o chip de inferência Groq 3 LPU, revelando detalhes do “surpresa” reservada na apresentação de resultados de fevereiro. Este chip foi adquirido pela NVIDIA em dezembro passado, por cerca de 20 bilhões de dólares, e é considerado um “co-processador de inferência” para a GPU Rubin, assumindo um papel importante na estratégia de inferência da NVIDIA.

Huang afirmou que, na era dos agentes de IA, a demanda por inferência está a se diversificar rapidamente. Para tarefas que exigem alta interatividade e respostas ultra-rápidas, as arquiteturas tradicionais de GPU apresentam redundância de desempenho. Assim, a NVIDIA introduziu a arquitetura LPU, focada na geração de tokens com latência extremamente baixa, trabalhando em colaboração com GPUs. A Vera Rubin cuida da fase de “pré-preenchimento” que exige cálculos massivos, enquanto a LPU lida com a fase de “decodificação” sensível à latência. Essa arquitetura híbrida pode aumentar até 35 vezes a taxa de inferência e eficiência energética do sistema.

“Na era da inferência de IA, não se trata apenas de atingir picos de parâmetros, mas de otimizar heterogeneamente com base na carga real, aproveitando ao máximo cada unidade de cálculo.” afirmou um responsável da YunTianLiFei, acrescentando que a era da inferência busca custo-benefício extremo, com maior necessidade de computação heterogênea, segmentando as características da carga de trabalho para que diferentes hardwares assumam tarefas mais adequadas, elevando a eficiência geral do sistema. A estratégia apresentada pela NVIDIA reflete essa abordagem. Empresas chinesas de chips de IA, como YunTianLiFei, continuam a inovar em arquiteturas de inferência, incluindo GPNPU, separação de PD e armazenamento 3D empilhado, seguindo a mesma direção industrial.

Revolucionando agentes de IA

OpenClaw, uma plataforma de agentes de IA de código aberto, tem impulsionado a tendência de “cultivo de camarões” globalmente. Na GTC, Huang elogiou o OpenClaw, dizendo que “abriu uma nova fronteira na IA para todos e se tornou o projeto de código aberto de crescimento mais rápido da história”, marcando o início de uma era de criação de agentes inteligentes pessoais.

A NVIDIA anunciou o lançamento do software Nemo Claw, compatível com a plataforma de agentes OpenClaw, permitindo instalação com um único comando, além de melhorar a gestão de segurança, confiabilidade, escalabilidade e usabilidade de agentes de IA.

Na conferência, a NVIDIA também reforçou parcerias com empresas líderes em software industrial, como Cadence, Siemens e Synopsys, além de integrar plataformas como CUDA-X, Omniverse e softwares industriais acelerados por GPU em empresas como Honda, Jaguar Land Rover, Samsung, SK Hynix e TSMC, acelerando processos de design industrial, engenharia e manufatura.

Huang afirmou: “Uma nova revolução industrial já começou, com IA física e agentes autônomos a transformar fundamentalmente o modo como projetamos, engenheiramos e fabricamos globalmente. Trabalhando com gigantes de software, provedores de serviços em nuvem e OEMs, a NVIDIA oferece uma plataforma de computação acelerada de ponta a ponta, capacitando diversos setores a transformar essa visão em realidade com velocidade e escala sem precedentes.”

No primeiro dia do evento, as ações da NVIDIA subiram 1,65%, fechando a 183,22 dólares por ação; porém, o índice de cadeias industriais relacionadas à NVIDIA na A-share recuou, liderado pelo conceito de módulos ópticos, com a Tenda Communications caindo cerca de 10%, a Zhongji Xuchuang caindo 3,33%, e a líder em PCB para IA, Shenghong Technology, caindo cerca de 3%.

Liderando a nova infraestrutura de computação

A NVIDIA continua a liderar a transformação da cadeia de indústria de IA. Com a complexidade crescente da arquitetura AI Fab da NVIDIA e o aumento do consumo de energia, as tecnologias tradicionais de refrigeração a ar atingiram seus limites físicos. A nova cabine Rubin, com design totalmente líquido, torna a refrigeração líquida uma necessidade central na nova geração de infraestrutura de computação.

Na conferência, a subsidiária LiminDa, controlada pela Lingyi Intelligent Manufacturing, foi a única fornecedora na China continental a participar do ecossistema Manifold (Distribuidor) da arquitetura Vera Rubin. Como componente central do sistema de circulação líquida, o distribuidor e os conectores rápidos determinam a eficiência e estabilidade do sistema de dissipação de calor.

Além disso, a arquitetura Rubin da NVIDIA pode impulsionar uma revolução nos materiais de embalagem.

“Devido às exigências extremas de dissipação de calor e transmissão de sinais na arquitetura Rubin, a comercialização de substratos de vidro foi significativamente acelerada.” afirmou Lu Bing, analista da Shenmeng Industry. Com a alta densidade de potência, os substratos orgânicos tradicionais (ABF) enfrentam sérios obstáculos físicos.

Fabricantes nacionais e internacionais estão em um momento crucial de transição de “validação tecnológica” para “produção em pequena escala”. Segundo previsões da Yole Group, 2026 será o ano em que os substratos de vidro entrarão na fase de produção comercial em pequena escala, e na área de HBM (memória de alta largura de banda) e empacotamento de chips lógicos, a demanda por materiais de vidro deve crescer a uma taxa composta anual de 33%.

Lu Bing destacou que o Brasil possui uma cadeia de produção de painéis completa e um grande mercado consumidor. Aproveitando essa escala, empresas nacionais já vislumbram avanços em materiais e equipamentos, como dispositivos de microperfuração a laser, podendo conquistar uma posição de destaque na cadeia de suprimentos de chips de IA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar