ME News Noticias, 19 de abril (UTC+8), Google Cloud anunció que su instancia A4X Max de metal desnudo puede soportar clústeres de hasta 50,000 GPU, con un ancho de banda de red que es el doble de la generación anterior.
Esta instancia pertenece a la serie de máquinas optimizadas para aceleradores de Google Compute Engine, que vienen preinstaladas con GPU NVIDIA, diseñadas específicamente para IA, aprendizaje automático, computación de alto rendimiento y aplicaciones intensivas en gráficos.
El documento detalla varias series de máquinas, incluyendo A4X Max, A4X, A4, A3, A2, G4 y G2, y recomienda series específicas según el tipo de carga de trabajo (como preentrenamiento, ajuste fino, inferencia, gráficos, computación de alto rendimiento).
Además, el documento explica las opciones de precios y consumo basadas en GPU preinstaladas, vCPU, memoria y SSD local (como bajo demanda, Spot, Flex-start, reservado), así como la experiencia de mantenimiento de diferentes tipos de máquinas.
(Fuente: InFoQ)

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

7 me gusta

Recompensa
7
8
2
Compartir

Comentar

Añadir un comentario

NoMoreRugs

· hace3h

El precio del SSD local finalmente es más transparente, antes estaba muy oculto.

Ver originalResponder0

ZkSketcher

· hace3h

Con la cobertura de toda la serie desde G2 hasta A4X, las pequeñas y medianas empresas también podrán aprovechar un poco.

Ver originalResponder0

GateUser-6fd3205e

· hace3h

¿Entrenar AI con instancias Spot? Interrumpir una vez y empezar desde cero, agotador de corazón

Ver originalResponder0

ChecksumSmile

· hace3h

Preentrenamiento recomendado A4X, inferencia con G2, esta división es bastante detallada.

Ver originalResponder0

FeeTaker

· hace3h

¿Flex-start qué novedad es esa, una mezcla de demanda y reserva?

Ver originalResponder0

RugProofRita

· hace3h

¿Puede Kubernetes soportar la complejidad de orquestación de un clúster de 50,000 tarjetas?

Ver originalResponder0

MistValleyFront

· hace3h

Google Cloud claramente está apuntando a competir con AWS Trainium.

Ver originalResponder0

DaoBackbencher

· hace3h

La frase "mantener la diferencia en la experiencia" es muy sutil, ¿significa que algunos fallarán?

Ver originalResponder0

Temas de actualidad
Ver más
#
WinGoldBarsWithGrowthPoints
1.25M Popularidad
#
WTICrudeFallsBelow90Dollars
1.21M Popularidad
#
IsraelStrikesIranBTCPlunges
51.65K Popularidad
#
StockTradingChallengeUpTo17000U
210.22K Popularidad
#
USIranNegotiationGame
9.36M Popularidad

Fijado

Google Cloud A4X Max instancia de metal desnudo admite clústeres de 50,000 GPU, el ancho de banda de red se duplica

Temas de actualidad

WinGoldBarsWithGrowthPoints

WTICrudeFallsBelow90Dollars

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USIranNegotiationGame

Fijado