智谱GLM-5.2 couronne le premier indice intelligent AA open source : GDPval égalant GPT-5.5 en performance

robot
Création du résumé en cours
Goldfinch Finance rapporte que le dernier modèle phare MoE d'AI de Zhipu, GLM-5.2, a obtenu un score de 51 dans l’évaluation de l’indice d’intelligence des grands modèles v4.1 d’Artificial Analysis, surpassant MiniMax-M3 (44 points), DeepSeek V4 Pro (max, 44 points) et Kimi K2.6 (43 points), en tête du classement mondial des modèles open source.
Dans le test GDPval-AA v2 simulant le travail de connaissance du monde réel, GLM-5.2 a obtenu 1524 points (avec une référence humaine de 1000 points), en tête de MiniMax-M3 (1418 points) et DeepSeek V4 Pro (max, 1328 points), égalant le modèle avancé fermé GPT-5.5 (raisonnement xhigh). Par rapport à la version précédente GLM-5.1, le raisonnement scientifique CritPt a augmenté de 16 points de pourcentage à 21 %, le HLE de 12 points de pourcentage à 40 %, TerminalBench v2.1 de 16 points de pourcentage à 78 %, et GPQA Diamond atteint 89 %.
GLM-5.2 occupe la meilleure position en rapport coût-efficacité sur la frontière de Pareto « Intelligence - Coût de tâche ». En raison d’une sortie moyenne de 43k tokens par tâche (contre 26k pour GLM-5.1), le coût moyen par tâche de GLM-5.2 a augmenté à environ 0,46 dollar, supérieur à celui de GLM-5.1 (0,25 dollar) et DeepSeek V4 Pro (max, 0,05 dollar), mais reste bien inférieur à celui des autres modèles de la même hiérarchie d’intelligence.
GLM-5.2 compte 744 milliards de paramètres, avec 40 milliards de paramètres actifs, la fenêtre de contexte passant de 200K à 1 million, et est open source selon la licence MIT. Actuellement, l’API officielle de Zhipu (tarification d’entrée 1,4, sortie 4,4 / par million de tokens) est en service sur des plateformes telles que SiliconFlow, DeepInfra, Nebius AI.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé