Microsoft vient de Goutte des spécifications intéressantes : leur dernière configuration pousse 15 200 tokens par seconde sur le GPU Blackwell Ultra de NVDA. C'est une solide augmentation de 27 % par rapport à la base précédente de 12 022 tokens/s. Les gains d'efficacité ici pourraient remodeler les coûts d'infrastructure en IA dans toute l'industrie.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

12 J'aime

Récompense
12
4
Reposter
Partager

Commentaire

0/400

TokenTaxonomist

· Il y a 2h

*en fait* ces chiffres nécessitent une validation taxonomique. mes feuilles de calcul suggèrent un delta de performance statistiquement insignifiant lorsqu'ils sont normalisés en fonction de la consommation d'énergie

Voir l'originalRépondre0

EthMaximalist