A GPU fez da Nvidia a empresa mais valiosa da história.


O chip que a substitui já está a ser construído por Google, Amazon, Meta, Microsoft e OpenAI simultaneamente.
Aqui está o que isso significa para onde o dinheiro realmente flui a seguir.
Primeiro, é preciso entender por que a GPU se tornou rei.
Volte a 2012.
Uma rede neural chamada AlexNet obliterou a concorrência num concurso global de reconhecimento de imagens usando uma única perceção.
A computação paralela que a Nvidia construiu nas GPUs para renderizar gráficos realistas em videojogos é estruturalmente idêntica ao que o treino de uma rede neural exige.
Milhares de núcleos menores realizando multiplicação de matrizes simultaneamente, em vez de um pequeno número de núcleos poderosos a executar tarefas sequenciais.
Um investigador pegou numa GPU e hackeou-a para expor essas capacidades de computação paralela para aprendizagem profunda.
Esse momento iniciou uma corrida de uma década que transformou a Nvidia de uma empresa de jogos numa camada de infraestrutura de toda a economia de IA.
Seis milhões de GPUs Blackwell foram enviadas só no último ano.
Um único armário de servidores Blackwell com 72 GPUs custa aproximadamente 3 milhões de dólares.
A Nvidia está a enviar mil deles todas as semanas.
Por um breve momento em outubro, a Nvidia tornou-se na primeira empresa da história a atingir uma avaliação de 5 biliões de dólares.
Isso é o que uma perceção de 2012 se transformou ao longo do tempo.
Mas a GPU tem um problema estrutural que ninguém estava a falar abertamente até recentemente.
É uma navalha suíça.
Extraordinariamente capaz numa vasta gama de tarefas de IA, mas não otimizada para nenhuma delas em particular.
Na era do boom dos grandes modelos de linguagem, essa flexibilidade era o objetivo.
O treino exigia computação paralela de propósito geral em massa, e a GPU entregava melhor do que qualquer outra disponível.
Mas à medida que os modelos amadureceram, o equilíbrio mudou.
Técnicas pós-treino tornaram os modelos cada vez mais capazes.
Agora, a carga de trabalho dominante não é o treino.
É a inferência.
Sempre que abre Claude, ChatGPT, Gemini, ou qualquer produto de IA e recebe uma resposta, isso é inferência.
Cada transação na app do Starbucks, cada fluxo de trabalho no Salesforce, cada assistente de IA a funcionar nos seus EarPods.
Tudo inferência.
E a inferência pode correr em chips menos potentes programados para tarefas mais específicas.
Essa mudança única no equilíbrio de carga de trabalho foi o que abriu a porta para o chip que agora está a ser construído para desafiar o domínio da Nvidia.
O ASIC é o chip que muda o mapa.
Circuito Integrado de Propósito Específico.
Onde uma GPU é uma navalha suíça, um ASIC é uma ferramenta de propósito único.
Hardwired para fazer exatamente as operações matemáticas de um tipo de trabalho.
Mais rápido nesse trabalho, mais eficiente em termos de energia, e significativamente mais barato de operar em escala para esse trabalho do que qualquer GPU de propósito geral.
A troca é a flexibilidade.
Uma vez gravado em silício, um ASIC não pode ser reprogramado para uma carga de trabalho diferente.
Mas para empresas que executam inferência na escala de bilhões de pedidos diários, essa troca não é uma desvantagem.
É precisamente o objetivo.
O Google foi o primeiro.
O TPU, Unidade de Processamento de Tensores, lançado em 2015, ajudou a liderar a invenção da arquitetura transformer em 2017.
O transformer é a base de virtualmente todo o sistema de IA moderno em funcionamento hoje.
O sétimo chip do Google, Ironwood, foi lançado recentemente juntamente com um acordo para treinar Claude com até um milhão de TPUs.
A Amazon construiu Trainium e Inferentia após adquirir uma startup de chips israelita em 2015.
A Anthropic está atualmente a treinar os seus modelos com meio milhão de chips Trainium2 dentro de um centro de dados da Amazon em Indiana, sem GPUs Nvidia na instalação.
O Trainium oferece entre 30 e 40 por cento melhor relação preço-desempenho do que os fornecedores de hardware concorrentes na AWS, segundo dados da própria Amazon.
A Meta tem o seu próprio acelerador de treino e inferência.
A Microsoft tem os seus chips Maia direcionados aos centros de dados Azure.
A OpenAI está a construir ASICs personalizados em parceria com a Broadcom a partir de 2026.
Cada grande hyperscaler está a construir o seu próprio chip simultaneamente.
Não como um experimento.
Como uma decisão estratégica de infraestrutura que vale centenas de bilhões de dólares em compromissos de capital.
A Broadcom é o nome que a maioria das pessoas fora da indústria de chips ainda não incorporou na sua tese.
Cada grande hyperscaler com um programa de ASICs parceiros com pelo menos uma empresa de design de chips para o IP, a expertise de engenharia, e a infraestrutura de rede que conecta os chips em escala.
A Broadcom domina esse mercado.
TPUs do Google. Acelerador de treino da Meta. Agora os ASICs personalizados da OpenAI.
Analistas que acompanham este espaço estimam que a Broadcom está a vencer entre 70 e 80 por cento do mercado de backend de ASICs personalizados.
Esse mercado deve crescer a uma taxa de crescimento anual composta de dois dígitos médios nos próximos cinco anos.
A onda de ASICs está a acelerar mais rápido do que o mercado de GPUs.
A Broadcom está no centro de quase tudo isso.
Depois há a camada de borda que a maioria ainda não está a seguir.
À medida que a IA nos centros de dados amadurece, o próximo campo de batalha é a inferência no dispositivo.
O seu telefone. O seu carro. O seu portátil. Os seus wearables.
A Unidade de Processamento Neural é o chip que alimenta a IA localmente, sem enviar dados de volta para um servidor na cloud.
Privacidade, velocidade e eficiência de custos melhoram quando a inferência corre no dispositivo em vez de num centro de dados.
A Qualcomm domina as NPUs para Android.
Os chips M-series da Apple incluem um motor neural dedicado para MacBooks.
Os chips da série A nos últimos iPhones têm aceleradores neurais incorporados.
A AMD e a Intel estão a competir por NPUs em portáteis Windows.
Hoje, o dinheiro está concentrado nos centros de dados.
Mas o volume de chips necessários para colocar IA em cada telefone, carro, robô e wearable na Terra é uma ordem de magnitude maior do que o mercado de centros de dados.
Essa transição já começou.
A camada geopolítica por trás de tudo isto é a restrição de que ninguém na narrativa do consumidor fala suficientemente.
Quase todos os chips neste ecossistema, Nvidia Blackwell, Google TPU, Amazon Trainium, Apple A-series, são fabricados por uma única empresa.
Taiwan Semiconductor Manufacturing Company.
TSMC.
A concentração de fabricação de semicondutores em nós avançados em Taiwan é o maior ponto de estrangulamento geopolítico na corrida global de IA.
A Lei CHIPS iniciou o processo de construção de fábricas da TSMC no Arizona.
O Blackwell da Nvidia está agora em produção total na instalação do Arizona.
A Intel está a fabricar chips de nós avançados numa nova fábrica no Arizona.
Mas o chip mais recente do iPhone da Apple ainda requer o processo de três nanómetros da TSMC, atualmente disponível apenas em Taiwan.
A relocalização da fabricação de semicondutores para os EUA está a acontecer, mas o calendário é de anos, não meses.
E a China está a construir a sua própria pilha paralela.
Huawei, ByteDance e Alibaba estão a desenvolver ASICs personalizados sob controles de exportação que limitam o acesso às tecnologias mais avançadas e aos chips Blackwell da Nvidia.
A corrida de chips de IA não é apenas uma competição tecnológica.
É uma guerra de infraestrutura geopolítica travada em silício.
O país que garantir a capacidade de fabricação mais avançada e a fonte de energia mais fiável para a sua operação vence algo muito mais valioso do que um mercado.
Aqui está o quadro que liga tudo isto.
A Nvidia conquistou a sua posição.
Anos de investimento no ecossistema de desenvolvedores, CUDA como uma barreira de software proprietária, e uma roadmap de hardware que se manteve à frente de todos os concorrentes construíram uma das vantagens competitivas mais duradouras da história da tecnologia.
Essa vantagem não desaparece da noite para o dia.
Mas o mercado está a tornar-se tão grande que cria espaço para uma camada totalmente nova de vencedores emergirem ao lado da Nvidia, em vez de simplesmente a substituir.
Os hyperscalers a reduzir a dependência da Nvidia através de ASICs personalizados.
A Broadcom a capturar toda a infraestrutura de backend de cada grande programa de ASICs simultaneamente.
Qualcomm e Apple a dominarem a camada de inferência na borda, à medida que a IA passa a estar em todos os dispositivos.
A TSMC a permanecer como o ponto de estrangulamento de fabricação insubstituível, independentemente de qual arquitetura de chip vença.
E, por baixo de tudo, a infraestrutura de energia necessária para operar tudo em escala, tornando-se na restrição que determina quem consegue realmente construir na velocidade exigida pela corrida de IA.
A GPU fez da Nvidia a empresa mais valiosa da história.
As empresas que entenderam esse momento de 2012, antes de se tornar óbvio, nunca precisaram explicar o seu timing.
A mesma lacuna de perceção existe agora na transição para ASICs.
As pessoas que prestam atenção à camada de chips por baixo da corrida de modelos já estão posicionadas.
As pessoas que agirem esta noite entenderão por que amanhã.
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado