A Google lançou a oitava geração de TPU, treinando e inferindo agora em duas chips independentes pela primeira vez

robot
Geração do resumo em andamento
ME News Notícias, 22 de abril (UTC+8), de acordo com o monitoramento do Beating, o CEO do Google Sundar Pichai anunciou na Cloud Next 2026 o 8ª geração de TPU, que pela primeira vez separa treinamento e inferência em dois chips independentes. TPU 8t voltado para treinamento. Um único nó superpoderoso pode conectar 9600 TPUs, oferecendo 121 ExaFlops de capacidade de processamento e 2PB de memória de alta largura de banda compartilhada, com desempenho de processamento três vezes maior que a geração anterior Ironwood, e eficiência energética até duas vezes melhor. A interconexão entre chips dobrou a largura de banda, combinada com a nova topologia de rede Virgo, podendo formar até 1 milhão de chips em um único cluster lógico, com expansão quase linear. O Google afirma que o objetivo é reduzir o ciclo de desenvolvimento de modelos de ponta de vários meses para algumas semanas. TPU 8i voltado para inferência. Um pod conecta 1152 TPUs, equipado com 288GB de memória de alta largura de banda e 384MB de SRAM on-chip, este último três vezes maior que o Ironwood, para manter os dados do modelo ativo o máximo possível no chip. A nova topologia de rede Boardfly reduz significativamente a latência, e o Google afirma que, com custos semelhantes, pode atender quase o dobro de clientes, com o objetivo de suportar milhões de agentes operando simultaneamente. Ambos os chips são hospedados na CPU Axion de arquitetura Arm desenvolvida pelo Google, com resfriamento líquido de quarta geração. Planejado para ser oficialmente disponibilizado no final de 2026 na plataforma Google Cloud AI Hypercomputer, junto com instâncias de GPU da Nvidia. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado