A indústria de IA muda o foco para a "inferência", conseguirá a Nvidia cumprir as "expectativas de biliões"?

Question

【Corresponsal Especial do Global Times nos EUA, Feng Yaren; Jornalista do Global Times, Yang Shuyu; Corresponsal Especial do Global Times, Ren Zhong】Na intensificação da competição global em inteligência artificial (IA), a gigante dos chips NVIDIA voltou a ser o centro das atenções no jogo tecnológico. No dia 16, horário local, realizou-se a GTC anual da NVIDIA, em San José, Califórnia. Este evento do setor atraiu dezenas de milhares de profissionais de tecnologia e provocou uma análise aprofundada da disputa por poder computacional: num contexto de concorrentes com excelente relação custo-benefício e de uma aceleração do processo de “des-NVIDIA-ização” dos gigantes, como é que esta potência de computação consolidará a sua posição dominante? E a sua avaliação de 5 trilhões de dólares poderá sustentar-se na onda intensa de “raciocínio” (inferência)? O mercado está a observar os próximos passos de NVIDIA e dos seus challengers.

Proteger a “barreira” com tecnologia

Na conferência, Jensen Huang, fundador da NVIDIA, revelou um novo processador central (CPU) e um sistema de IA baseado na tecnologia da Groq, uma startup especializada na produção de chips personalizados para inferência. O objetivo é melhorar a velocidade de resposta dos sistemas de IA. Segundo a apresentação, este novo sistema de servidores combinará a unidade de processamento de linguagem (LPU) desenvolvida pela Groq com o servidor Vera Rubin, criando uma infraestrutura de inferência de IA totalmente nova.

De acordo com a Bloomberg, a LPU, como um chip dedicado, é especializada em acelerar o “raciocínio” de grandes modelos de linguagem — ou seja, a geração de respostas a prompts de IA. Nesta arquitetura, a NVIDIA fornece a LPU como um “co-processador” para trabalhar em conjunto com o acelerador principal, que é mais eficiente na execução de tarefas mais complexas e de múltiplas fases. Huang afirmou que esta arquitetura oferece um desempenho de cálculo significativamente superior ao da geração anterior de GPUs.

Nos últimos anos, a NVIDIA acelerou notavelmente o ritmo de desenvolvimento tecnológico. Hoje, a empresa já não se limita às suas GPUs emblemáticas. “Eles estão a ligar essas tecnologias para proteger a sua barreira competitiva”, afirmou Daniel Newman, CEO do Futurum Group, uma firma de análise tecnológica, ao falar deste novo produto. Na GTC, Huang também mostrou os avanços da NVIDIA em robótica, condução autónoma e agentes de IA.

As ações fecharam em alta no dia

A NVIDIA tenta acalmar a ansiedade do mercado quanto ao crescimento, com expectativas de desempenho ambiciosas. Anteriormente, a empresa previa que os chips Blackwell e Rubin, baseados em novas arquiteturas, poderiam gerar uma oportunidade de receita de 5000 bilhões de dólares até 2026. Este ano, na GTC, Huang previu que o seu mais recente processador de IA ajudará a criar vendas de 1 trilhão de dólares até 2027.

Impulsionada por esta previsão, as ações da NVIDIA subiram até 4% no dia, antes de a subida diminuir, fechando com um aumento de 1,2%, o que temporariamente aliviou as preocupações do mercado sobre o seu potencial de crescimento e a possível “bolha de IA”. Segundo a Bloomberg, o valor das ações da empresa tem estado estagnado nos últimos meses, tendo uma queda acumulada de 3,4% antes do início da GTC.

A Reuters comentou que apostar em chips de inferência de IA demonstra que Huang está empenhado em consolidar a posição da NVIDIA no setor de “cálculo de inferência” (ou seja, o processo de a IA fornecer respostas). Com a mudança global da indústria de IA do “competição de modelos (treinamento)” para a “implementação comercial (inferência)”, gigantes como OpenAI e Anthropic estão a deslocar o foco estratégico da aquisição de chips para treinar modelos de IA para o atendimento a milhões de utilizadores finais. Como os chips de inferência, após o fim do “treinamento” e na fase de aplicação, apresentam uma eficiência energética muito superior à dos processadores de alta potência usados na fase de construção do modelo, há um interesse crescente no mercado global por hardware de inferência mais barato e mais compacto. Huang afirmou que “o ponto de viragem na inferência já chegou”, acrescentando que “a procura continua a crescer”.

Investimento de capital na onda de “inferência”

Embora a NVIDIA ainda detenha cerca de 90% do mercado, a concorrência no setor de hardware de IA ao seu redor já se está a consolidar. A “Business Insider” dos EUA relatou que os preços das GPUs da NVIDIA são elevados, e que, à medida que os clientes procuram reduzir a dependência, vários concorrentes estão a emergir. Empresas como Meta estão a acelerar o desenvolvimento de chips próprios. Simultaneamente, a Bloomberg mencionou que os CPUs, que inicialmente estavam atrás na área de treino, estão a mostrar um potencial de substituição devido à sua vantagem de custo na fase de implantação.

O foco da IA também está a evoluir. Segundo a “Business Insider”, embora as GPUs dominem na fase de treino, a inferência é um processo contínuo, altamente sensível ao custo. Grandes provedores de nuvem e startups estão a desenvolver chips de IA concorrentes, especialmente na área de inferência. A Amazon lançou as séries Trainium e Inferentia como alternativas de baixo custo à NVIDIA. A Microsoft também lançou recentemente o chip de inferência IA Maia 200. Além disso, muitas startups estão a desenvolver chips dedicados mais baratos e eficientes do que as GPUs, tentando redefinir os padrões do setor. Com dezenas de bilhões de dólares de capital a entrar nesta onda de tecnologia de inferência, várias empresas unicórnio altamente competitivas já surgiram neste setor.

Por outro lado, a China continua a ser o maior desafio geopolítico para a NVIDIA. Segundo a “Business Insider”, as restrições de segurança e comércio impostas pelo governo dos EUA limitam o potencial de crescimento da NVIDIA. Huang já alertou várias vezes que bloquear as vendas para a China só acelerará o desenvolvimento da indústria local chinesa. A Huawei, que ocupa uma posição central na indústria doméstica, é vista como a concorrente mais direta da NVIDIA. A Huawei não só fabrica chips, servidores e equipamentos de rede, como também opera a sua própria plataforma de nuvem. Paralelamente, startups chinesas de chips, como a Cambrian, estão a emergir como alternativas viáveis à NVIDIA.

Na entrevista ao “Global Times”, o presidente da Aliança de Consumo de Informação de Zhongguancun, Xiang Ligang, afirmou que, no setor de hardware de IA, a NVIDIA mantém uma vantagem significativa, difícil de ser derrubada a curto prazo. Contudo, o mercado de inferência está a surgir com mais produtos, e a competição futura provavelmente se centrará no preço. Muitas empresas desejam usar preços mais baixos para desafiar a liderança da NVIDIA, uma área onde a NVIDIA não possui uma vantagem clara.

A indústria de IA muda o foco para a "inferência", conseguirá a Nvidia cumprir as "expectativas de biliões"?

Tópicos em destaque

Gate13thAnniversaryGlobalCelebration

TradFiIntroducesMultiLeverageFirst

IsraelStrikesIranBTCPlunges

FedHoldsRatesSteady

CreatorLeaderboard

Gate Fun tendência

ElizaOSv2

全新AI开源框架

龙虾🦞

Token

MAOTAI

来口茅台

trump

Melanoma

来根华子

来根华子

Fixar