Le GLM-5.2 open source est incroyablement rentable, coûtant moins d’un quart d’Opus 4.8, mais avec seulement 90 points de différence, cette évaluation m’a fait crier « vraiment génial »

Voir l'original
CoinNetwork
AA-Briefcase publié : Claude Fable 5 remporte la victoire, GLM-5.2 se glisse dans le top trois
Artificial Analysis lance la première référence d’évaluation à long terme des connaissances pour les agents intelligents de grands modèles, couvrant quatre scénarios : science des données, gestion de produit, opérations bancaires et stratégies pour l’industrie lourde, avec 91 tâches développées par des experts de Google, McKinsey et Boston Consulting. Les résultats montrent que Claude Fable 5 remporte la première place, Opus 4.8 arrive en deuxième, et GLM-5.2 se classe parmi les trois premiers ; mais selon la norme de perfection pour chaque tâche, le taux de réussite de Fable 5 n’est que de 3 %. La note globale de GLM-5.2 en open source n’est inférieure que de 90 points à celle d’Opus 4.8, avec un coût inférieur à 25 % de celui de ce dernier.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé