Microsoft acaba de Soltar algunas especificaciones interesantes: su última configuración está empujando 15,200 tokens por segundo en la GPU Blackwell Ultra de NVDA. Eso representa un sólido aumento del 27% desde la línea base anterior de 12,022 tokens/s. Las ganancias de eficiencia aquí podrían remodelar los costos de infraestructura de IA en general.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
12 me gusta
Recompensa
12
4
Republicar
Compartir
Comentar
0/400
TokenTaxonomist
· hace6h
*en realidad* esos números necesitan validación taxonómica. mis hojas de cálculo sugieren un delta de rendimiento estadísticamente insignificante cuando se normaliza por consumo de energía
Microsoft acaba de Soltar algunas especificaciones interesantes: su última configuración está empujando 15,200 tokens por segundo en la GPU Blackwell Ultra de NVDA. Eso representa un sólido aumento del 27% desde la línea base anterior de 12,022 tokens/s. Las ganancias de eficiencia aquí podrían remodelar los costos de infraestructura de IA en general.