Epoch AI Research menilai kinerja model baru Meta Muse Spark pada tolok ukur FrontierMath

robot
Pembuatan abstrak sedang berlangsung

Berita ME, 9 April (UTC+8), Epoch AI Research baru-baru ini mendapatkan akses pratinjau ke model baru Meta Muse Spark, dan mengevaluasinya pada benchmark FrontierMath. Hasil evaluasi menunjukkan bahwa Muse Spark memperoleh skor 39% pada Tier 1-3, dan skor 15% pada Tier 4. Menurut pandangan dalam artikel, kinerja ini kompetitif dibandingkan beberapa model terdepan baru-baru ini, tetapi masih tertinggal dari GPT-5.4. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan