Zhipu AI lance l'API haute vitesse GLM-5.1 à 400 jetons par seconde

Zhipu AI a lancé l'API haute vitesse GLM-5.1 pour certains clients entreprises, avec une vitesse de sortie atteignant 400 tokens par seconde. Zhipu AI a déclaré que le service utilise un moteur d'inférence développé conjointement avec TileRT et continuera d'ajouter l'inférence FP8 ainsi que la prise en charge de contextes ultra-longs.
ZHIPU-9,05%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé