A Google lançou a oitava geração de TPU, treinando e inferindo agora em duas chips independentes pela primeira vez

ME News Notícias, 22 de abril (UTC+8), de acordo com o monitoramento do Beating, o CEO do Google Sundar Pichai anunciou na Cloud Next 2026 o 8ª geração de TPU, que pela primeira vez separa treinamento e inferência em dois chips independentes. TPU 8t voltado para treinamento. Um único nó super pode conectar 9600 TPUs, oferecendo 121 ExaFlops de poder de processamento e 2PB de memória de alta largura de banda compartilhada, com desempenho de processamento três vezes maior que a geração anterior Ironwood, e eficiência energética até duas vezes melhor. A largura de banda de interconexão entre chips dobrou, combinada com a nova topologia de rede Virgo, podendo conectar até um milhão de chips formando um único cluster lógico, com expansão quase linear. O Google afirma que o objetivo é reduzir o ciclo de desenvolvimento de modelos de ponta de vários meses para algumas semanas. TPU 8i voltado para inferência. Um pod conecta 1152 TPUs, equipado com 288GB de memória de alta largura de banda e 384MB de SRAM on-chip, este último três vezes maior que o Ironwood, para manter os dados do modelo ativo o máximo possível no chip. A nova topologia de rede Boardfly reduz significativamente a latência, e o Google afirma que, com custos semelhantes, pode atender quase o dobro de clientes, com o objetivo de suportar milhões de agentes operando simultaneamente. Ambos os chips são hospedados na CPU Axion, arquitetura ARM desenvolvida pelo Google, com resfriamento líquido de quarta geração. Planejado para ser oficialmente disponibilizado no final de 2026 na plataforma Google Cloud AI Hypercomputer, junto com instâncias de GPU da Nvidia. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado