A Nvidia entra no negócio de "criação de camarões" e aposta tudo na era de IA de inferência de bilião de dólares

robot
Geração de resumo em curso

Destaques Ações de escolha Centro de Dados Centro de Mercado Fluxo de Capital Negociação Simulada

Cliente

A gigante mundial de computação NVIDIA está a transformar-se de uma fabricante de chips numa fábrica de IA, apostando nas oportunidades do mercado de inferência de inteligência artificial. No GTC 2026 (Conferência de Tecnologia GPU), que começou a 17 de março, o CEO da NVIDIA, Jensen Huang, aumentou significativamente as previsões de receita para a nova geração de chips de IA, visando atingir o objetivo de 1 trilhão de dólares, e lançou oficialmente a próxima plataforma de hardware, além de produtos como uma pilha de software para “cultivo de camarões”.

Profissionais do setor comentam que um sinal forte do GTC deste ano é que a era da inferência está a acelerar. Além disso, a nova arquitetura de computação da NVIDIA liderará mudanças nos setores de dissipação de calor, materiais de embalagem e outros.

Aumento na aposta na inferência de IA

Na conferência, a NVIDIA destacou que, nesta nova fase de agentes de IA, a inferência se tornará o núcleo da competição em infraestrutura de IA. A empresa lançou oficialmente a próxima plataforma de computação Vera Rubin e o chip LPU (Unidade de Processamento de Linguagem) Groq3.

“Antes, ao falar de Hopper, mostrava um chip; agora, ao falar de Vera Rubin, as pessoas pensam no sistema completo.” Jensen Huang prevê que, nos últimos anos, a demanda de computação cresceu 1 milhão de vezes, e estima que, entre 2025 e 2027, esse crescimento trará pelo menos 1 trilhão de dólares de receita para a empresa.

A plataforma Vera Rubin inclui 7 chips, 5 sistemas de rack e um supercomputador para IA baseada em agentes, incluindo a nova CPU Vera e a arquitetura de armazenamento Blue Field-4S TX. Comparada com a geração anterior Blackwell, a nova plataforma requer apenas um quarto do número de GPUs para treinar modelos de especialistas híbridos de grande escala, com um aumento de até 10 vezes na taxa de inferência por watt.

Na conferência, Huang destacou o chip de inferência Groq 3 LPU, revelando detalhes do “surpresa” apresentada na reunião de resultados de fevereiro. Este chip foi adquirido pela NVIDIA em dezembro do ano passado, por cerca de 20 mil milhões de dólares, e é considerado um “co-processador de inferência” para a GPU Rubin, assumindo um papel importante na estratégia de inferência da NVIDIA.

Huang afirmou que, na era dos agentes de IA, a demanda por inferência está a se diversificar rapidamente. Para tarefas que exigem alta interatividade e respostas ultra-rápidas, as arquiteturas tradicionais de GPU apresentam redundância de desempenho. Assim, a NVIDIA introduziu a arquitetura LPU, focada na geração de tokens com “baixa latência extrema”, trabalhando em conjunto com GPUs. A Vera Rubin cuida da fase de “pré-preenchimento” que exige cálculos massivos, enquanto a LPU lida com a fase de “decodificação” sensível à latência. Essa arquitetura híbrida pode aumentar até 35 vezes a taxa de inferência e a eficiência energética do sistema.

“A era da inferência de IA não se trata mais apenas de atingir picos de parâmetros, mas de otimizar de forma heterogênea com base na carga real de trabalho, usando cada recurso de computação ao máximo.” Um responsável da Cloud Tianli Fei afirmou que, na era da inferência, a busca por relação custo-benefício extrema exige computação heterogênea, segmentando as cargas de trabalho para diferentes hardwares, aumentando a eficiência geral do sistema. A estratégia apresentada pela NVIDIA reflete essa abordagem. Empresas chinesas de chips de IA, como Cloud Tianli Fei, continuam a inovar em arquiteturas de inferência, incluindo GPNPU, separação de PD e armazenamento empilhado em 3D, seguindo a mesma direção industrial.

Inovação em agentes de IA

O OpenClaw, uma plataforma de agentes de IA de código aberto, tem causado entusiasmo global na área de “cultivo de camarões”. No GTC, Huang elogiou o OpenClaw, dizendo que “abriu uma nova fronteira na IA para todos e se tornou o projeto de código aberto de crescimento mais rápido da história”, marcando o início de uma era de criação de agentes inteligentes pessoais.

A NVIDIA anunciou o lançamento do software Nemo Claw, compatível com a plataforma de agentes OpenClaw, permitindo instalação com um único comando, além de melhorar a segurança, confiabilidade, escalabilidade e facilidade de uso dos agentes de IA.

Na conferência, a NVIDIA também reforçou parcerias com empresas líderes de software industrial, como Cadence, Siemens e Synopsys, além de integrar suas plataformas CUDA-X, Omniverse e ferramentas aceleradas por GPU em empresas como Honda, Jaguar Land Rover, Samsung, SK Hynix e TSMC, para acelerar o design industrial, desenvolvimento de engenharia e processos de fabricação.

Huang afirmou: “Uma nova revolução industrial já começou, com IA física e agentes autônomos a transformar fundamentalmente o modo como projetamos, engenheiramos e fabricamos globalmente. Através de parcerias com gigantes de software, provedores de serviços em nuvem e OEMs, a NVIDIA oferece uma plataforma de computação acelerada de ponta a ponta, capacitando várias indústrias a transformar essa visão em realidade com velocidade e escala sem precedentes.”

No primeiro dia do evento, as ações da NVIDIA subiram 1,65%, fechando a 183,22 dólares por ação; no entanto, o índice de cadeia industrial da NVIDIA na A-Share recuou, com o conceito de módulos ópticos liderando a queda, Tanfeng Communication caiu cerca de 10%, Zhongji Xuchuang caiu 3,33%, e a líder em PCB para IA, Shenghong Technology, caiu cerca de 3%.

Liderando a nova infraestrutura de computação

A NVIDIA continua a liderar a transformação da cadeia de valor de IA. Com a crescente complexidade da arquitetura AI Fab da NVIDIA e o aumento do consumo de energia, as técnicas tradicionais de refrigeração a ar atingiram seus limites físicos. A nova estante Rubin utiliza um design de refrigeração líquida 100%, tornando o líquido de resfriamento um componente essencial na nova infraestrutura de computação.

Na conferência, a subsidiária LiminDa, do grupo Lingyi, foi a única fornecedora na China continental a participar do ecossistema Vera Rubin Manifold (Distribuidor de Água). Como componente central do sistema de circulação líquida, o distribuidor e os conectores rápidos determinam a eficiência e estabilidade do sistema de dissipação de calor.

Além disso, a arquitetura Rubin da NVIDIA pode impulsionar mudanças nos materiais de embalagem.

“Devido às exigências extremas de dissipação de calor e transmissão de sinais na arquitetura Rubin, a comercialização de substratos de vidro foi significativamente acelerada.” Segundo Lu Bing, analista da Shenmeng Industry, sob alta densidade de computação, os substratos orgânicos tradicionais (ABF) enfrentam sérios obstáculos físicos.

Fabricantes nacionais e internacionais estão em um momento crucial de transição de “validação tecnológica” para “produção em pequena escala”. Segundo previsões da Yole Group, 2026 será o ano em que os substratos de vidro entrarão na fase de produção comercial em pequena quantidade, com uma taxa de crescimento anual composta de 33% na demanda por materiais de vidro em encapsulamentos de HBM (memória de alta largura de banda) e chips lógicos.

Lu Bing destacou que as empresas domésticas, com uma cadeia de produção de painéis completa e um grande mercado consumidor, podem aproveitar essa escala para avançar em materiais e equipamentos, como dispositivos de microperfuração a laser, conquistando uma posição central na cadeia de suprimentos de chips de IA.

(Origem: Securities Times)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar