GLM-5.1 obtient la première place open source du classement de code LMArena, et la troisième mondiale

robot
Création du résumé en cours

Selon la surveillance de 1M AI News, la plateforme d’évaluation d’IA autorisée mondiale LMArena (avec un million d’utilisateurs participant à des tests à l’aveugle) a mis à jour le classement dédié à Code Arena, avec le modèle GLM-5.1 en tête du classement mondial des modèles open source, se classant troisième au niveau mondial.
GLM-5.1 non seulement hérite des capacités de codage SOTA open source de la génération précédente, mais réalise également des avancées dans les tâches à long terme (Long-Horizon Task), en réalisant :

  1. Construire un bureau Linux à partir de zéro en 8 heures ;
  2. 655 itérations pour dépasser le goulot d’étranglement de l’optimisation de la base de données vectorielle ;
  3. 1000 cycles d’appel d’outils pour optimiser la charge réelle du modèle d’apprentissage automatique.
    Il est à noter qu’avec les mêmes critères d’évaluation sur le classement METR, GLM-5.1 est le seul modèle open source capable de fonctionner en continu pendant 8 heures, et l’un des rares modèles dans le monde, à l’exception de Claude Opus 4.6, à posséder cette capacité.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler