Google Cloud A4X Max instância de metal nu supporta cluster de 50.000 GPUs, largura de banda de rede dobrada

robot
Geração do resumo em andamento
ME News Notícias, 19 de abril (UTC+8), o Google Cloud anunciou que sua instância A4X Max de metal nu pode suportar um cluster de até 50.000 GPUs, com largura de banda de rede duas vezes maior que a do produto anterior. Essa instância pertence à série de máquinas otimizadas para aceleradores do Google Compute Engine, que vêm com GPUs NVIDIA pré-instaladas, projetadas para IA, aprendizado de máquina, computação de alto desempenho e aplicações intensivas em gráficos. A documentação detalha várias séries de máquinas, incluindo A4X Max, A4X, A4, A3, A2, G4 e G2, e recomenda as séries apropriadas com base no tipo de carga de trabalho (como pré-treinamento, ajuste fino, inferência, gráficos, computação de alto desempenho). Além disso, a documentação também explica as opções de preços e consumo baseadas em GPU pré-instaladas, vCPU, memória e SSD local (sob demanda, Spot, Flex-start, reservado), bem como a experiência de manutenção de diferentes tipos de máquinas. (Fonte: InFoQ)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 8
  • 2
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
NoMoreRugs
· 2h atrás
O preço do SSD local finalmente ficou mais transparente, antes estava bem escondido
Ver originalResponder0
ZkSketcher
· 2h atrás
Da série completa de G2 a A4X, pequenas e médias empresas também podem aproveitar uma oportunidade
Ver originalResponder0
GateUser-6fd3205e
· 2h atrás
Treinar IA com instância Spot? Uma interrupção e tudo começa do zero, dá um cansaço.
Ver originalResponder0
ChecksumSmile
· 2h atrás
Pré-treinamento recomendado A4X, inferência usando G2, essa divisão é bastante detalhada.
Ver originalResponder0
FeeTaker
· 2h atrás
Flex-start é uma novidade, uma mistura de sob demanda e reserva?
Ver originalResponder0
RugProofRita
· 2h atrás
A complexidade de agendamento de um cluster de 50.000 cartões, o Kubernetes consegue suportar?
Ver originalResponder0
MistValleyFront
· 2h atrás
A rodada do Google Cloud claramente está competindo com o AWS Trainium.
Ver originalResponder0
DaoBackbencher
· 2h atrás
A frase "manutenção de experiência diferente" é muito sutil, quer dizer que alguns podem falhar?
Ver originalResponder0
  • Fixado