AMD presenta resultados innovadores de MLPerf Inference 6.0

robot
Generación de resúmenes en curso

La última presentación de AMD en MLPerf Inference 6.0 muestra avances significativos con sus GPU Instinct MI355X, superando los 1 millón de tokens por segundo a escala multinodo y ampliándose a nuevas cargas de trabajo como la generación de texto a video. Los resultados demuestran un rendimiento competitivo de nodo único frente a las GPU NVIDIA B200 y B300, un escalado eficiente y una amplia reproducibilidad en el ecosistema, atribuida en gran medida al stack de software AMD ROCm. Estos logros sitúan a AMD como un fuerte contendiente en el mercado de la inferencia de IA generativa, con una hoja de ruta clara para futuras series de GPU Instinct y soluciones a escala de rack.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado