ME News Notícias, 19 de abril (UTC+8), o Google Cloud anunciou que sua instância A4X Max de metal nu pode suportar um cluster de até 50.000 GPUs, com largura de banda de rede duas vezes maior que a do produto anterior. Essa instância pertence à série de máquinas otimizadas para aceleradores do Google Compute Engine, que vêm com GPUs NVIDIA pré-instaladas, projetadas para IA, aprendizado de máquina, computação de alto desempenho e aplicações intensivas em gráficos. A documentação detalha várias séries de máquinas, incluindo A4X Max, A4X, A4, A3, A2, G4 e G2, e recomenda as séries apropriadas com base no tipo de carga de trabalho (como pré-treinamento, ajuste fino, inferência, gráficos, computação de alto desempenho). Além disso, a documentação também explica as opções de preços e consumo baseadas em GPU pré-instaladas, vCPU, memória e SSD local (sob demanda, Spot, Flex-start, reservado), bem como a experiência de manutenção de diferentes tipos de máquinas. (Fonte: InFoQ)

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

7 Curtidas

Recompensa
7
8
2
Compartilhar

Comentário

Adicionar um comentário

NoMoreRugs

· 2h atrás

O preço do SSD local finalmente ficou mais transparente, antes estava bem escondido

Ver originalResponder0

ZkSketcher

· 2h atrás

Da série completa de G2 a A4X, pequenas e médias empresas também podem aproveitar uma oportunidade

Ver originalResponder0

GateUser-6fd3205e

· 2h atrás

Treinar IA com instância Spot? Uma interrupção e tudo começa do zero, dá um cansaço.

Ver originalResponder0

ChecksumSmile

· 2h atrás

Pré-treinamento recomendado A4X, inferência usando G2, essa divisão é bastante detalhada.

Ver originalResponder0

FeeTaker

· 2h atrás

Flex-start é uma novidade, uma mistura de sob demanda e reserva?

Ver originalResponder0

RugProofRita

· 2h atrás

A complexidade de agendamento de um cluster de 50.000 cartões, o Kubernetes consegue suportar?

Ver originalResponder0

MistValleyFront

· 2h atrás

A rodada do Google Cloud claramente está competindo com o AWS Trainium.

Ver originalResponder0

DaoBackbencher

· 2h atrás

A frase "manutenção de experiência diferente" é muito sutil, quer dizer que alguns podem falhar?

Ver originalResponder0

Tendências
Ver projetos
#
WinGoldBarsWithGrowthPoints
1.23M Popularidade
#
WTICrudeFallsBelow90Dollars
1.21M Popularidade
#
IsraelStrikesIranBTCPlunges
51.65K Popularidade
#
StockTradingChallengeUpTo17000U
211.39K Popularidade
#
USIranNegotiationGame
9.36M Popularidade

Fixado

sitemap

Google Cloud A4X Max instância de metal nu supporta cluster de 50.000 GPUs, largura de banda de rede dobrada

Tendências

WinGoldBarsWithGrowthPoints

WTICrudeFallsBelow90Dollars

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USIranNegotiationGame

Fixado