Google Cloud A4X Max instancia de metal desnudo admite clústeres de 50,000 GPU, el ancho de banda de red se duplica

robot
Generación de resúmenes en curso
ME News Noticias, 19 de abril (UTC+8), Google Cloud anunció que su instancia A4X Max de metal desnudo puede soportar clústeres de hasta 50,000 GPU, con un ancho de banda de red que es el doble de la generación anterior.
Esta instancia pertenece a la serie de máquinas optimizadas para aceleradores de Google Compute Engine, que vienen preinstaladas con GPU NVIDIA, diseñadas específicamente para IA, aprendizaje automático, computación de alto rendimiento y aplicaciones intensivas en gráficos.
El documento detalla varias series de máquinas, incluyendo A4X Max, A4X, A4, A3, A2, G4 y G2, y recomienda series específicas según el tipo de carga de trabajo (como preentrenamiento, ajuste fino, inferencia, gráficos, computación de alto rendimiento).
Además, el documento explica las opciones de precios y consumo basadas en GPU preinstaladas, vCPU, memoria y SSD local (como bajo demanda, Spot, Flex-start, reservado), así como la experiencia de mantenimiento de diferentes tipos de máquinas.
(Fuente: InFoQ)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 8
  • 2
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
NoMoreRugs
· hace3h
El precio del SSD local finalmente es más transparente, antes estaba muy oculto.
Ver originalResponder0
ZkSketcher
· hace3h
Con la cobertura de toda la serie desde G2 hasta A4X, las pequeñas y medianas empresas también podrán aprovechar un poco.
Ver originalResponder0
GateUser-6fd3205e
· hace3h
¿Entrenar AI con instancias Spot? Interrumpir una vez y empezar desde cero, agotador de corazón
Ver originalResponder0
ChecksumSmile
· hace3h
Preentrenamiento recomendado A4X, inferencia con G2, esta división es bastante detallada.
Ver originalResponder0
FeeTaker
· hace3h
¿Flex-start qué novedad es esa, una mezcla de demanda y reserva?
Ver originalResponder0
RugProofRita
· hace3h
¿Puede Kubernetes soportar la complejidad de orquestación de un clúster de 50,000 tarjetas?
Ver originalResponder0
MistValleyFront
· hace3h
Google Cloud claramente está apuntando a competir con AWS Trainium.
Ver originalResponder0
DaoBackbencher
· hace3h
La frase "mantener la diferencia en la experiencia" es muy sutil, ¿significa que algunos fallarán?
Ver originalResponder0
  • Fijado