Tinygrad afirma que GLM5.2 puede alcanzar 120 tok/s en una configuración Blackwell de doble máquina conectadas, con un precio de 150,000 dólares.

robot
Generación de resúmenes en curso

BlockBeats Noticias, 21 de junio, el vendedor de GPU Tinygrad publicó que, según información confiable, el modelo GLM 5.2 puede lograr una velocidad de inferencia de 120 tokens por segundo en dos tinybox conectados en red con arquitectura Blackwell.

Este equipo tiene un precio de 150,000 dólares, y puede ser configurado con dos tinybox estándar o un tinybox Pro, ambos capaces de alcanzar el rendimiento mencionado. Tinygrad destaca esto como un punto de venta, promoviendo una estrategia de despliegue privado de "compra única, sin pagar nunca por la nube", en competencia directa con los servicios de inferencia en la nube basados en pago por uso.

Actualmente, esta noticia no ha sido confirmada oficialmente por GLM, y Tinygrad no ha divulgado más detalles técnicos.


Haz clic en el enlace del texto original a continuación para unirte a la canal de noticias de AI de Beating · Feishu, que monitorea de forma continua las tendencias y noticias globales de IA las 24 horas del día, los 7 días de la semana.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado