Opus 4.6/4.7 comble le déficit en mathématiques pour atteindre le même niveau que la capacité en codage, cet indicateur ECI est intéressant — il mesure la difficulté relative entre les modèles, pas par rapport à l'humain, alors ne le confondez pas avec « surpasser les mathématiciens humains »

Voir l'original
MeNews
Epoch AI publie la carte des spécialités de Claude : la compétence en codage est toujours là, Opus 4.6 et 4.7 ont comblé les lacunes en mathématiques
L'analyse de l'indice de capacité spécifique au domaine d'Epoch AI montre que la série Claude est en tête depuis longtemps en matière de codage, mais que ses compétences en mathématiques sont relativement faibles ; les données les plus récentes indiquent que cette disparité s'atténue rapidement. Auparavant, Claude avait un score SWE-ECI supérieur au score global, avec une différence avec Math-ECI, mais Opus 4.6/4.7 a réduit ces deux scores à moins d'un point, comblant ainsi la lacune. L'ECI reflète la difficulté relative des tâches entre modèles, et non la difficulté pour les humains.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé