Tinygrad affirme que GLM5.2 peut atteindre 120 tok/s en configuration Blackwell connectée en double machine, au prix de 150 000 dollars.

robot
Création du résumé en cours

BlockBeats Nouvelles, le 21 juin, le vendeur de GPU Tinygrad a publié un article indiquant, selon des sources fiables, que le modèle GLM 5.2 peut réaliser une vitesse d'inférence de 120 tokens par seconde sur deux tinybox Blackwell connectés en réseau.

Cette configuration coûte 150 000 dollars, avec la possibilité de choisir deux tinybox standard ou un seul tinybox Pro, tous deux capables d'atteindre la performance mentionnée. Tinygrad met en avant cela comme argument de vente, en adoptant une stratégie de déploiement privé « achat unique, jamais de frais cloud » pour une solution on-premise, en concurrence directe avec les services d'inférence cloud à la demande.

Actuellement, cette information n’a pas été confirmée par l’équipe officielle de GLM, et Tinygrad n’a pas divulgué plus de détails techniques.


Cliquez sur le lien original ci-dessous pour rejoindre le canal d’actualités AI de Feishu Beating · Dòngchá, surveillant en continu 24/7 les tendances et actualités mondiales de l’IA.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé