Google Cloud A4X Max instancia de metal desnudo admite clústeres de 50,000 GPU, con el doble de ancho de banda de red

robot
Generación de resúmenes en curso
ME News Noticias, 19 de abril (UTC+8), Google Cloud anunció que su instancia A4X Max de metal desnudo puede soportar clústeres de hasta 50,000 GPU, con un ancho de banda de red que es el doble de la generación anterior.
Esta instancia pertenece a la serie de máquinas optimizadas para aceleradores de Google Compute Engine, que vienen preinstaladas con GPU NVIDIA, diseñadas para IA, aprendizaje automático, computación de alto rendimiento y aplicaciones intensivas en gráficos.
El documento detalla varias series de máquinas, incluyendo A4X Max, A4X, A4, A3, A2, G4 y G2, y recomienda series específicas según el tipo de carga de trabajo (como preentrenamiento, ajuste fino, inferencia, gráficos, computación de alto rendimiento).
Además, el documento explica las opciones de precios y consumo basadas en GPU preinstaladas, vCPU, memoria y SSD local (como pago por uso, Spot, Flex-start, reservado), así como la experiencia de mantenimiento de diferentes tipos de máquinas.
(Fuente: InFoQ)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 8
  • 2
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
MossyLedger
· hace2h
Preentrenamiento, ajuste fino, inferencia todo incluido, Google quiere que las personas vivan y mueran en su nube
Ver originalResponder0
GateUser-8da82d63
· hace7h
Basado en la recomendación de tipos de instancia según la carga de trabajo, para no tener que calcular TFLOPS por mí mismo.
Ver originalResponder0
BoredInBlockspace
· hace8h
Las instancias reservadas son adecuadas para negocios con alta certeza, pero ¿quién puede garantizar el entrenamiento de un gran modelo?
Ver originalResponder0
GateUser-eccf92a1
· hace8h
La oferta de GPU de Google Cloud finalmente ha alcanzado el ritmo, antes solicitando A100 y esperando una eternidad
Ver originalResponder0
BlocktimeBarista
· hace8h
El metal desnudo significa que no hay gastos de virtualización, vale la pena el dinero gastado.
Ver originalResponder0
ExitLiquidityIntern
· hace8h
La experiencia de mantenimiento del clúster de 50,000 tarjetas... ¿Cuántos SRE se necesitan para dormir bien?
Ver originalResponder0
TreatMemesAsBeliefs
· hace8h
La transparencia en los precios de los SSD locales es algo bueno, antes los costos de almacenamiento de algunos proveedores de la nube eran como abrir una caja de sorpresas.
Ver originalResponder0
StakingDaydreamer
· hace8h
Los proveedores de la nube están enloqueciendo, ¿quieren con un clúster de 50,000 GPU arrebatar el trabajo del centro de supercomputación?
Ver originalResponder0
  • Fijado