Google Cloud A4X Max instância de metal nu supporta cluster de 50.000 GPUs, com largura de banda de rede dobrada

robot
Geração do resumo em andamento
ME News Notícias, 19 de abril (UTC+8), o Google Cloud anunciou que sua instância A4X Max de metal nu pode suportar um cluster de até 50.000 GPUs, com largura de banda de rede duas vezes maior que a do produto anterior. Essa instância pertence à série de máquinas otimizadas para aceleradores do Google Compute Engine, que vem pré-instalada com GPUs NVIDIA, projetada para IA, aprendizado de máquina, computação de alto desempenho e aplicações intensivas em gráficos. A documentação detalha várias séries de máquinas, incluindo A4X Max, A4X, A4, A3, A2, G4 e G2, e recomenda séries específicas com base no tipo de carga de trabalho (como pré-treinamento, ajuste fino, inferência, gráficos, computação de alto desempenho). Além disso, a documentação também explica as opções de precificação e consumo baseadas em GPU pré-instalada, vCPU, memória e SSD local (sob demanda, Spot, Flex-start, reservado), bem como a experiência de manutenção de diferentes tipos de máquinas. (Fonte: InFoQ)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 8
  • 2
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
MossyLedger
· 33m atrás
Pré-treinamento, ajuste fino, inferência tudo incluso, a Google quer fazer as pessoas viverem e morrerem na sua nuvem.
Ver originalResponder0
GateUser-8da82d63
· 6h atrás
Com base na recomendação de tipos de instância para carga de trabalho, para eu não precisar calcular TFLOPS sozinho
Ver originalResponder0
BoredInBlockspace
· 6h atrás
Instâncias reservadas são adequadas para negócios com alta certeza, mas quem pode garantir o treinamento de um grande modelo?
Ver originalResponder0
GateUser-eccf92a1
· 6h atrás
A oferta de GPU do Google Cloud finalmente acompanhou o ritmo, antes solicitar A100 levava uma eternidade
Ver originalResponder0
BlocktimeBarista
· 6h atrás
Bare metal significa que não há overhead de virtualização, esse dinheiro vale a pena.
Ver originalResponder0
ExitLiquidityIntern
· 6h atrás
A experiência de manutenção do cluster de 50.000 cartões... quantos engenheiros de SRE seriam necessários para dormir bem?
Ver originalResponder0
TreatMemesAsBeliefs
· 6h atrás
A transparência nos preços de SSDs locais é uma coisa boa, anteriormente algumas empresas de nuvem cobravam pelo armazenamento como se fosse uma caixa de surpresa.
Ver originalResponder0
StakingDaydreamer
· 6h atrás
Os provedores de nuvem estão enlouquecendo, um cluster de 50 mil GPUs é para competir com o centro de supercomputação?
Ver originalResponder0
  • Fixado