MEニュース 情報、4月9日(UTC+8)、Epoch AI Researchは最近、Metaの新しいモデルMuse Sparkの事前アクセス権を取得し、FrontierMathベンチマークで評価を行いました。評価結果によると、Muse SparkのTier 1-3でのスコアは39%で、Tier 4では15%でした。記事中の見解によれば、このパフォーマンスは直近の複数の最先端モデルと比べて競争力がある一方で、GPT-5.4には及びません。(出典:InFoQ)
Epoch AI Researchは、Metaの新モデルMuse SparkがFrontierMathベンチマークで示したパフォーマンスを評価しました。
MEニュース 情報、4月9日(UTC+8)、Epoch AI Researchは最近、Metaの新しいモデルMuse Sparkの事前アクセス権を取得し、FrontierMathベンチマークで評価を行いました。評価結果によると、Muse SparkのTier 1-3でのスコアは39%で、Tier 4では15%でした。記事中の見解によれば、このパフォーマンスは直近の複数の最先端モデルと比べて競争力がある一方で、GPT-5.4には及びません。(出典:InFoQ)