Zhipu AI lanza GLM-5.1 API de alta velocidad a 400 tokens por segundo

Zhipu AI lanzó la API de alta velocidad GLM-5.1 para clientes empresariales seleccionados, con una velocidad de salida que alcanza los 400 tokens por segundo. Zhipu AI dijo que el servicio utiliza un motor de inferencia desarrollado conjuntamente con TileRT y continuará agregando inferencia FP8 y soporte para contextos ultra largos.
ZHIPU26,55%
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado