A Nvidia entra no negócio de "criação de camarões" e aposta tudo na era de IA de inferência de bilião de dólares

robot
Geração de resumo em curso

Os gigantes globais de computação, como a NVIDIA, estão a transformar-se de fabricantes de chips em fábricas de IA, apostando nas oportunidades do mercado de inferência de inteligência artificial. No NVIDIA GTC 2026, que começou a 17 de março, o CEO Huang Renxun aumentou significativamente as expectativas de receita para a nova geração de chips de IA, mirando um objetivo de 1 trilhão de dólares, além de lançar oficialmente a próxima plataforma de hardware e produtos como uma pilha de software para “cultivo de camarões”.

Profissionais do setor comentam que um sinal forte do GTC deste ano é que a era da inferência está a acelerar. Além disso, a nova arquitetura de computação da NVIDIA liderará mudanças nos setores de dissipação de calor, materiais de embalagem e outros.

Apostando na inferência de IA

Na conferência, a NVIDIA destacou que, na nova fase de agentes de IA, a inferência será o núcleo da competição em infraestrutura de IA, lançando oficialmente a próxima plataforma de computação Vera Rubin e o chip Groq3 LPU (Unidade de Processamento de Linguagem).

“Antes, ao falar de Hopper, mostrava um chip; agora, ao falar de Vera Rubin, as pessoas pensam no sistema completo.” Huang estimou que, nos últimos anos, a demanda de computação cresceu 1 milhão de vezes, prevendo que entre 2025 e 2027 esse crescimento trará pelo menos 1 trilhão de dólares em receitas para a empresa.

A plataforma Vera Rubin da NVIDIA, apresentada nesta ocasião, inclui 7 chips, 5 sistemas de rack e um supercomputador para IA baseada em agentes, incluindo a nova CPU Vera e a arquitetura de armazenamento Blue Field-4S TX. Comparada à geração anterior, Blackwell, a nova plataforma requer apenas um quarto do número de GPUs para treinar modelos de especialistas híbridos de grande escala, com um aumento de até 10 vezes na taxa de inferência por watt.

Na apresentação, Huang destacou o chip de inferência Groq 3 LPU, revelando detalhes do “surpresa” reservada na apresentação de resultados de fevereiro. Este chip foi adquirido pela NVIDIA em dezembro passado, por cerca de 20 bilhões de dólares, e é considerado um “co-processador de inferência” para a GPU Rubin, assumindo um papel importante na estratégia de inferência da NVIDIA.

Huang afirmou que, na era dos agentes de IA, a demanda por inferência está a se diversificar rapidamente. Para tarefas que exigem alta interatividade e respostas ultra-rápidas, as arquiteturas tradicionais de GPU apresentam redundância de desempenho. Assim, a NVIDIA introduziu a arquitetura LPU, focada na geração de tokens com “latência extremamente baixa”, trabalhando em colaboração com GPUs. A Vera Rubin cuida da fase de “pré-preenchimento” que exige cálculos massivos, enquanto a LPU lida com a fase de “decodificação” sensível à latência. Essa arquitetura híbrida pode aumentar até 35 vezes a taxa de inferência e a eficiência energética do sistema.

“A era da inferência de IA não se resume a parâmetros de pico, mas a otimizações heterogêneas mais granulares, capazes de aproveitar ao máximo cada unidade de cálculo.” afirmou um responsável da YunTianLiFei, acrescentando que a era da inferência busca custo-benefício extremo, com maior necessidade de computação heterogênea, segmentando as cargas de trabalho para diferentes hardwares, elevando a eficiência geral do sistema. A estratégia apresentada pela NVIDIA reflete essa abordagem. Empresas chinesas de chips de IA, como YunTianLiFei, continuam a inovar em arquiteturas de inferência, como GPNPU, separação de PD e armazenamento 3D empilhado, seguindo a mesma direção industrial.

Inovando os agentes de IA

O OpenClaw, uma plataforma de agentes de IA de código aberto, tem impulsionado a tendência de “cultivo de camarões” globalmente. No GTC, Huang elogiou o OpenClaw, dizendo que “abriu uma nova fronteira na IA para todos e se tornou o projeto de código aberto de crescimento mais rápido da história”, marcando o início de uma era de criação de agentes inteligentes pessoais.

A NVIDIA anunciou o lançamento do software Nemo Claw, compatível com a plataforma de agentes OpenClaw, permitindo instalação com um único comando, além de melhorar a gestão de segurança, confiabilidade, escalabilidade e usabilidade dos agentes de IA.

Na conferência, a NVIDIA reforçou sua colaboração com empresas líderes globais de software industrial, como Cadence, Siemens e Synopsys, integrando plataformas como CUDA-X, Omniverse e softwares industriais acelerados por GPU em empresas como Honda, Jaguar Land Rover, Samsung, SK Hynix e TSMC, para acelerar o design industrial, desenvolvimento de engenharia e processos de fabricação.

Huang afirmou: “Uma nova revolução industrial já começou, com IA física e agentes autônomos a transformar fundamentalmente o modo como projetamos, engenheiramos e fabricamos globalmente. Através de parcerias com gigantes de software, provedores de serviços em nuvem e OEMs, a NVIDIA oferece uma plataforma de computação acelerada de ponta a ponta, capacitando diversos setores a transformar essa visão em realidade com velocidade e escala sem precedentes.”

No primeiro dia do evento, as ações da NVIDIA subiram 1,65%, fechando a 183,22 dólares por ação; porém, o índice da cadeia industrial da NVIDIA nas ações chinesas caiu, liderado pelo conceito de módulos ópticos, com Tanfeng Communications caindo cerca de 10%, Zhongji Xuchuang caindo 3,33%, e a líder em PCBs de IA, Shenghong Technology, caindo cerca de 3%.

Liderando a nova geração de infraestrutura de computação

A NVIDIA continua a liderar a transformação da cadeia de IA. Com a complexidade crescente da arquitetura AI Fab da NVIDIA e o aumento do consumo de energia, as técnicas tradicionais de refrigeração a ar atingiram limites físicos. O novo gabinete Rubin, com design totalmente líquido, torna a refrigeração líquida uma necessidade fundamental na nova infraestrutura de computação.

Na conferência, a subsidiária LiminDa, controlada pela Lingyi Zhi Zao, foi a única fornecedora na China continental da ecologia do sistema Manifold (divisor de água) da arquitetura Vera Rubin da NVIDIA. Como componente central do sistema de circulação líquida, o desempenho do divisor de água e das conexões rápidas influencia diretamente a eficiência e estabilidade do sistema de dissipação de calor.

Além disso, a arquitetura Rubin da NVIDIA pode impulsionar uma revolução nos materiais de embalagem.

“Devido às exigências extremas de dissipação de calor e transmissão de sinais na arquitetura Rubin, a comercialização de substratos de vidro foi significativamente acelerada.” afirmou Lu Bing, analista da Shenmeng Industry. Com a alta densidade de cálculo, os substratos orgânicos tradicionais (ABF) enfrentam sérios obstáculos físicos.

Fabricantes nacionais e internacionais estão em um momento crucial de transição de “validação tecnológica” para “produção em pequena escala”. Segundo previsões da Yole Group, 2026 será o ano em que os substratos de vidro entrarão na fase de produção comercial em pequena escala, com uma taxa de crescimento anual composta de 33% na demanda por materiais de vidro em áreas como HBM e empacotamento de chips lógicos.

Lu Bing destacou que empresas chinesas, com uma cadeia de produção de painéis completa e um grande mercado consumidor, podem aproveitar essa escala para liderar avanços em materiais e equipamentos, como dispositivos de microperfuração a laser, conquistando uma posição central na cadeia de suprimentos de chips de IA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar