Google Cloud A4X Max instância de metal nu supporta cluster de 50.000 GPUs, com largura de banda de rede duplicada

robot
Geração de resumo em curso
ME News Notícias, 19 de abril (UTC+8), o Google Cloud anunciou que sua instância nua de metal A4X Max suporta clusters de até 50.000 GPUs, com largura de banda de rede duas vezes maior que a do produto anterior.
A instância pertence à série de máquinas otimizadas para aceleradores do Google Compute Engine, que vêm pré-instalados com GPUs NVIDIA, projetadas para IA, aprendizagem de máquina, computação de alto desempenho e aplicações gráficas intensivas.
A documentação detalha várias séries de máquinas, incluindo A4X Max, A4X, A4, A3, A2, G4 e G2, e recomenda séries específicas com base no tipo de carga de trabalho (como pré-treinamento, ajuste fino, inferência, gráficos, computação de alto desempenho).
Além disso, a documentação explica as opções de preços e consumo baseadas em GPU pré-instaladas, vCPU, memória e SSD local (sob demanda, Spot, Flex-start, reservado), bem como a experiência de manutenção de diferentes tipos de máquinas.
(Fonte: InFoQ)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 8
  • 2
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
NoMoreRugs
· 3h atrás
Os preços do SSD local finalmente tornaram-se mais transparentes, antes estavam escondidos profundamente.
Ver originalResponder0
ZkSketcher
· 3h atrás
Da série completa de G2 a A4X, pequenas e médias empresas também podem aproveitar uma oportunidade
Ver originalResponder0
GateUser-6fd3205e
· 3h atrás
Treinar IA com instâncias Spot? Uma interrupção e tem que começar do zero, dá cansaço
Ver originalResponder0
ChecksumSmile
· 3h atrás
Pré-treinamento recomendado A4X, inferência com G2, essa divisão é bastante detalhada.
Ver originalResponder0
FeeTaker
· 3h atrás
Flex-start é uma novidade, uma mistura de sob demanda e reserva?
Ver originalResponder0
RugProofRita
· 3h atrás
A complexidade de agendamento de um cluster de 50.000 cartões, o Kubernetes consegue suportar?
Ver originalResponder0
MistValleyFront
· 3h atrás
A Google Cloud claramente está competindo com a AWS Trainium nesta jogada.
Ver originalResponder0
DaoBackbencher
· 3h atrás
A frase "manutenção e experiência de diferença" é muito sutil, quer dizer que alguns podem falhar?
Ver originalResponder0
  • Fixado