Epoch AI Research menilai kinerja model baru Meta Muse Spark pada tolok ukur FrontierMath

MeNews · 2026-04-08T23:23:18+00:00

Epoch AI Research mendapatkan akses pratinjau model baru Meta Muse Spark dan melakukan evaluasi, hasilnya menunjukkan kinerja yang kompetitif pada tolok ukur FrontierMath, tetapi masih tertinggal dibandingkan GPT-5.4.

MeNews

2026-04-08 23:23:18

Pembuatan abstrak sedang berlangsung

Berita ME, 9 April (UTC+8), Epoch AI Research baru-baru ini mendapatkan akses pratinjau ke model baru Meta Muse Spark, dan mengevaluasinya pada benchmark FrontierMath. Hasil evaluasi menunjukkan bahwa Muse Spark memperoleh skor 39% pada Tier 1-3, dan skor 15% pada Tier 4. Menurut pandangan dalam artikel, kinerja ini kompetitif dibandingkan beberapa model terdepan baru-baru ini, tetapi masih tertinggal dari GPT-5.4. (Sumber: InFoQ)

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

1 Suka