A GPU fez da Nvidia a empresa mais valiosa da história.


O chip que a substitui já está sendo construído por Google, Amazon, Meta, Microsoft e OpenAI simultaneamente.
Aqui está o que isso significa para onde o dinheiro realmente flui a seguir.
Primeiro, você precisa entender por que a GPU se tornou rei.
Volte para 2012.
Uma rede neural chamada AlexNet obliterou a concorrência em um concurso global de reconhecimento de imagens usando uma única percepção.
O processamento paralelo que a Nvidia construiu em GPUs para renderizar gráficos realistas em videogames é estruturalmente idêntico ao que o treinamento de uma rede neural exige.
Milhares de núcleos menores realizando multiplicação de matrizes simultaneamente, em vez de um pequeno número de núcleos poderosos executando tarefas sequenciais.
Um pesquisador pegou uma GPU e a hackeou para expor essas capacidades de computação paralela para aprendizado profundo.
Esse momento iniciou uma corrida de uma década que transformou a Nvidia de uma empresa de jogos em uma camada de infraestrutura de toda a economia de IA.
Seis milhões de GPUs Blackwell foram entregues apenas no último ano.
Um único rack de servidores Blackwell com 72 GPUs custa aproximadamente 3 milhões de dólares.
A Nvidia está enviando mil deles a cada semana.
Por um breve momento em outubro, a Nvidia se tornou a primeira empresa na história a atingir uma avaliação de 5 trilhões de dólares.
Isso é o que uma percepção de 2012 se transformou ao longo do tempo.
Mas a GPU tem um problema estrutural que ninguém estava falando alto até recentemente.
Ela é uma faca suíça.
Extraordinariamente capaz em uma ampla gama de cargas de trabalho de IA, mas não otimizada para nenhuma delas especificamente.
Na era do boom dos grandes modelos de linguagem, essa flexibilidade era o ponto.
O treinamento exigia computação paralela de propósito geral em grande escala, e a GPU entregava isso melhor do que qualquer outra coisa disponível.
Mas à medida que os modelos amadureceram, o equilíbrio mudou.
Técnicas pós-treinamento tornaram os modelos cada vez mais capazes.
Agora, a carga de trabalho dominante não é o treinamento.
É uma inferência.
Toda vez que você abre Claude, ChatGPT, Gemini, ou qualquer produto de IA e recebe uma resposta, isso é inferência.
Cada transação no aplicativo Starbucks, cada fluxo de trabalho no Salesforce, cada assistente de IA rodando nos seus EarPods.
Tudo é inferência.
E a inferência pode rodar em chips menos potentes programados para tarefas mais específicas.
Essa mudança única no equilíbrio de carga de trabalho foi o que abriu a porta para o chip que agora está sendo construído para desafiar o domínio da Nvidia.
O ASIC é o chip que muda o mapa.
Circuito Integrado de Propósito Específico.
Onde uma GPU é uma faca suíça, um ASIC é uma ferramenta de propósito único.
Hardwired para fazer exatamente as operações matemáticas para um tipo de trabalho.
Mais rápido nesse trabalho, mais eficiente em termos de energia nesse trabalho, e significativamente mais barato para operar em escala para esse trabalho do que qualquer GPU de propósito geral.
A troca é a flexibilidade.
Uma vez gravado em silício, um ASIC não pode ser reprogramado para uma carga de trabalho diferente.
Mas para empresas que executam inferência na escala de bilhões de solicitações diárias, essa troca não é uma desvantagem.
É exatamente o ponto.
O Google foi o primeiro.
O TPU, Unidade de Processamento de Tensores, lançado em 2015, ajudou a liderar a invenção da arquitetura Transformer em 2017.
O Transformer é a base de praticamente todos os sistemas de IA modernos que existem hoje.
O sétimo chip do Google, Ironwood, foi lançado recentemente junto com um acordo para treinar Claude em até um milhão de TPUs.
A Amazon construiu Trainium e Inferentia após adquirir uma startup de chips israelense em 2015.
A Anthropic está atualmente treinando seus modelos com meio milhão de chips Trainium2 dentro de um centro de dados da Amazon em Indiana, sem GPUs Nvidia na instalação.
O Trainium oferece entre 30 e 40 por cento melhor relação custo-desempenho do que fornecedores de hardware concorrentes na AWS, de acordo com dados da própria Amazon.
A Meta tem seu próprio acelerador de treinamento e inferência.
A Microsoft possui seus chips Maia voltados para centros de dados Azure.
A OpenAI está construindo ASICs personalizados em parceria com a Broadcom a partir de 2026.
Cada grande hyperscaler está construindo seu próprio chip simultaneamente.
Não como um experimento.
Como uma decisão estratégica de infraestrutura que vale centenas de bilhões de dólares em compromisso de capital.
A Broadcom é o nome que a maioria das pessoas fora da indústria de chips ainda não precificou em sua tese.
Cada grande hyperscaler com um programa de ASICs parceiros com pelo menos uma empresa de design de chips para o IP, a expertise de engenharia, e a infraestrutura de rede que conecta os chips em escala.
A Broadcom domina esse mercado.
TPUs do Google. Acelerador de treinamento da Meta. Agora os ASICs personalizados da OpenAI.
Analistas que acompanham esse espaço estimam que a Broadcom está vencendo de 70 a 80 por cento do mercado de ASICs personalizados de backend.
Esse mercado deve crescer a uma taxa de crescimento anual composta de dois dígitos médios nos próximos cinco anos.
A onda de ASICs está acelerando mais rápido do que o mercado de GPUs.
A Broadcom está no centro de quase tudo isso.
Depois há a camada de borda que a maioria das pessoas ainda não acompanha.
À medida que o AI em centros de dados amadurece, o próximo campo de batalha é a inferência no dispositivo.
Seu telefone. Seu carro. Seu laptop. Seus wearables.
A Unidade de Processamento Neural é o chip que alimenta a IA localmente, sem enviar dados de volta para um servidor na nuvem.
Privacidade, velocidade e eficiência de custos melhoram quando a inferência roda no dispositivo em vez de em um centro de dados.
A Qualcomm domina NPUs para Android.
Os chips da série M da Apple incluem um motor neural dedicado para MacBooks.
Os chips da série A nos últimos iPhones têm aceleradores neurais integrados.
AMD e Intel estão competindo por NPUs em laptops com Windows.
Os dólares estão concentrados hoje em centros de dados.
Mas o volume de chips necessários para colocar IA em cada telefone, carro, robô e wearable na Terra é uma ordem de magnitude maior do que o mercado de centros de dados.
Essa transição já começou.
A camada geopolítica por trás de tudo isso é a restrição que ninguém na narrativa de consumo está falando o suficiente.
Quase todos os chips nesse ecossistema, Nvidia Blackwell, Google TPU, Amazon Trainium, Apple série A, são fabricados por uma única empresa.
Taiwan Semiconductor Manufacturing Company.
TSMC.
A concentração de fabricação de semicondutores em nós avançados em Taiwan é o maior ponto de estrangulamento geopolítico na corrida global de IA.
O CHIPS Act iniciou o processo de construção de fábricas da TSMC no Arizona.
O Blackwell da Nvidia já está em produção total na instalação do Arizona.
A Intel está fabricando chips de nó avançado em uma nova fábrica no Arizona.
Mas o chip mais recente do iPhone da Apple ainda requer o processo de três nanômetros da TSMC, atualmente disponível apenas em Taiwan.
A relocalização da fabricação de semicondutores para os EUA está acontecendo, mas o cronograma é de anos, não meses.
E a China está construindo sua própria pilha paralela.
Huawei, ByteDance e Alibaba estão desenvolvendo ASICs personalizados sob controles de exportação que limitam seu acesso aos equipamentos mais avançados e aos chips Blackwell da Nvidia.
A corrida de chips de IA não é apenas uma competição tecnológica.
É uma guerra de infraestrutura geopolítica sendo travada em silício.
O país que garantir a capacidade de fabricação mais avançada e a fonte de energia mais confiável para operá-la vence algo muito mais valioso do que um mercado.
Aqui está o quadro que conecta tudo isso.
A Nvidia conquistou sua posição.
Anos de investimento no ecossistema de desenvolvedores, CUDA como uma barreira de software proprietária, e um roteiro de hardware que permaneceu à frente de todos os concorrentes construíram uma das vantagens competitivas mais duradouras da história da tecnologia.
Essa vantagem não desaparece da noite para o dia.
Mas o mercado está ficando tão grande que cria espaço para uma camada totalmente nova de vencedores emergirem ao lado da Nvidia, em vez de simplesmente substituí-la.
Os hyperscalers reduzindo sua dependência da Nvidia por meio de ASICs personalizados.
A Broadcom capturando toda a infraestrutura de backend de cada grande programa de ASICs simultaneamente.
Qualcomm e Apple dominando a camada de inferência na borda enquanto a IA se move para todos os dispositivos.
A TSMC permanecendo como o ponto de estrangulamento de fabricação insubstituível, independentemente de qual arquitetura de chip vença.
E, abaixo de tudo, a infraestrutura de energia necessária para operar tudo em escala, tornando-se o fator limitante que determina quem realmente consegue construir na velocidade que a corrida de IA exige.
A GPU fez da Nvidia a empresa mais valiosa da história.
As empresas que entenderam esse momento de 2012, antes que se tornasse óbvio, nunca precisaram explicar seu timing.
A mesma lacuna de percepção existe agora na transição para ASICs.
As pessoas que prestam atenção na camada de chips abaixo da corrida de modelos já estão posicionadas.
As pessoas que agirem sobre isso esta noite entenderão por que amanhã.
Ver original
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado