ME News ニュース、4月9日(UTC+8)、Epoch AI Researchは最近、Metaの新モデルMuse Sparkのプレリリースアクセス権を獲得し、FrontierMathベンチマークで評価を行いました。評価結果は、Muse SparkがTier 1-3で39%、Tier 4で15%のスコアを記録したことを示しています。記事の見解によると、そのパフォーマンスは最近の複数の最先端モデルと比較して競争力がありますが、GPT-5.4には遅れをとっています。(出典:InFoQ)
Epoch AI Research は、Meta の新しいモデル Muse Spark が FrontierMath ベンチマークで示したパフォーマンスを評価しました。
ME News ニュース、4月9日(UTC+8)、Epoch AI Researchは最近、Metaの新モデルMuse Sparkのプレリリースアクセス権を獲得し、FrontierMathベンチマークで評価を行いました。評価結果は、Muse SparkがTier 1-3で39%、Tier 4で15%のスコアを記録したことを示しています。記事の見解によると、そのパフォーマンスは最近の複数の最先端モデルと比較して競争力がありますが、GPT-5.4には遅れをとっています。(出典:InFoQ)