Epoch AI Research évalue la performance du nouveau modèle de Meta, Muse Spark, sur le benchmark FrontierMath

robot
Création du résumé en cours

Actualités ME : message du 9 avril (UTC+8). Epoch AI Research a récemment obtenu un accès anticipé au nouveau modèle Meta Muse Spark et l’a évalué sur le benchmark FrontierMath. Les résultats de l’évaluation montrent que Muse Spark obtient 39 % de score sur les niveaux Tier 1-3 et 15 % sur le niveau Tier 4. Selon l’avis exprimé dans l’article, cette performance est compétitive par rapport à plusieurs modèles de pointe récents, mais elle est inférieure à GPT-5.4. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler