Nvidia publica los detalles de costos de Blackwell: las GPU son el doble de caras, cada token cuesta 35 veces menos

robot
Generación de resúmenes en curso

La noticia de CoinWorld informa que Nvidia ha publicado detalles de costos sobre su serie Blackwell, señalando que el costo de la GPU es el doble que el de la generación anterior, pero el costo por token es 35 veces más barato. Según el blog de Nvidia, al evaluar la infraestructura de inferencia, se debe prestar atención al «costo por token» en lugar de al «costo por GPU por hora». Tomando como objeto de prueba el modelo de inferencia MOE deepseek-r1, se comparan Blackwell (GB300 NVL72) y la generación anterior Hopper (HGX H200). Según los precios de referencia del mercado en la nube, Blackwell cuesta 2.65 dólares por GPU por hora, casi el doble que los 1.41 dólares de Hopper, pero la producción de tokens por GPU por segundo pasa de 90 a 6000, un aumento de 65 veces, y el costo por cada millón de tokens se reduce de 4.20 dólares a 0.12 dólares. Es importante señalar que el costo de 0.12 dólares se obtiene bajo la premisa de activar varias optimizaciones de software, como inferencia de baja precisión FP4 y predicción de múltiples tokens.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado