Microsoft vient de Goutte des spécifications intéressantes : leur dernière configuration pousse 15 200 tokens par seconde sur le GPU Blackwell Ultra de NVDA. C'est une solide augmentation de 27 % par rapport à la base précédente de 12 022 tokens/s. Les gains d'efficacité ici pourraient remodeler les coûts d'infrastructure en IA dans toute l'industrie.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
12 J'aime
Récompense
12
4
Reposter
Partager
Commentaire
0/400
TokenTaxonomist
· Il y a 2h
*en fait* ces chiffres nécessitent une validation taxonomique. mes feuilles de calcul suggèrent un delta de performance statistiquement insignifiant lorsqu'ils sont normalisés en fonction de la consommation d'énergie
Microsoft vient de Goutte des spécifications intéressantes : leur dernière configuration pousse 15 200 tokens par seconde sur le GPU Blackwell Ultra de NVDA. C'est une solide augmentation de 27 % par rapport à la base précédente de 12 022 tokens/s. Les gains d'efficacité ici pourraient remodeler les coûts d'infrastructure en IA dans toute l'industrie.