ME News Notícias, 19 de abril (UTC+8), o Google Cloud anunciou que sua instância nua de metal A4X Max suporta clusters de até 50.000 GPUs, com largura de banda de rede duas vezes maior que a do produto anterior.
A instância pertence à série de máquinas otimizadas para aceleradores do Google Compute Engine, que vêm pré-instalados com GPUs NVIDIA, projetadas para IA, aprendizagem de máquina, computação de alto desempenho e aplicações gráficas intensivas.
A documentação detalha várias séries de máquinas, incluindo A4X Max, A4X, A4, A3, A2, G4 e G2, e recomenda séries específicas com base no tipo de carga de trabalho (como pré-treinamento, ajuste fino, inferência, gráficos, computação de alto desempenho).
Além disso, a documentação explica as opções de preços e consumo baseadas em GPU pré-instaladas, vCPU, memória e SSD local (sob demanda, Spot, Flex-start, reservado), bem como a experiência de manutenção de diferentes tipos de máquinas.
(Fonte: InFoQ)

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

7 gostos

Recompensa
7
8
2
Partilhar

Comentar

Adicionar um comentário

NoMoreRugs

· 3h atrás

Os preços do SSD local finalmente tornaram-se mais transparentes, antes estavam escondidos profundamente.

Ver originalResponder0

ZkSketcher

· 3h atrás

Da série completa de G2 a A4X, pequenas e médias empresas também podem aproveitar uma oportunidade

Ver originalResponder0

GateUser-6fd3205e

· 3h atrás

Treinar IA com instâncias Spot? Uma interrupção e tem que começar do zero, dá cansaço

Ver originalResponder0

ChecksumSmile

· 3h atrás

Pré-treinamento recomendado A4X, inferência com G2, essa divisão é bastante detalhada.

Ver originalResponder0

FeeTaker

· 3h atrás

Flex-start é uma novidade, uma mistura de sob demanda e reserva?

Ver originalResponder0

RugProofRita

· 3h atrás

A complexidade de agendamento de um cluster de 50.000 cartões, o Kubernetes consegue suportar?

Ver originalResponder0

MistValleyFront

· 3h atrás

A Google Cloud claramente está competindo com a AWS Trainium nesta jogada.

Ver originalResponder0

DaoBackbencher

· 3h atrás

A frase "manutenção e experiência de diferença" é muito sutil, quer dizer que alguns podem falhar?

Ver originalResponder0

Tópicos em destaque
Ver mais
#
WinGoldBarsWithGrowthPoints
1.25M Popularidade
#
WTICrudeFallsBelow90Dollars
1.21M Popularidade
#
IsraelStrikesIranBTCPlunges
51.65K Popularidade
#
StockTradingChallengeUpTo17000U
210.22K Popularidade
#
USIranNegotiationGame
9.36M Popularidade

Fixado

Google Cloud A4X Max instância de metal nu supporta cluster de 50.000 GPUs, com largura de banda de rede duplicada

Tópicos em destaque

WinGoldBarsWithGrowthPoints

WTICrudeFallsBelow90Dollars

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USIranNegotiationGame

Fixado