Biaya Pembuktian Teorema Mulai Meningkat: Mistral Merilis Leanstral 1.5 Sumber Terbuka, Sekitar $4 Per Masalah

Menurut pemantauan oleh Dongcha Beating, Mistral AI telah merilis Leanstral 1.5, sebuah model yang dirancang untuk pembuktian formal dalam Lean 4. Model ini memiliki total 119 miliar parameter, dengan sekitar 6,5 miliar parameter aktif, dan dilisensikan di bawah protokol Apache-2.0, menawarkan akses API gratis. Evaluasi resmi menunjukkan bahwa Leanstral 1.5 memecahkan 587 dari 672 masalah di PutnamBench; ia mencapai 87% dan 34% pada tolok ukur aljabar abstrak FATE-H dan FATE-X, masing-masing, menetapkan rekor kinerja baru di antara model serupa. Biaya rata-rata per masalah untuk Leanstral 1.5 di PutnamBench adalah sekitar $4, jauh lebih rendah dibandingkan biaya beberapa sistem sebelumnya, yang berkisar antara puluhan hingga ratusan dolar. Seiring meningkatnya anggaran token per masalah, jumlah masalah yang dapat dipecahkan terus bertambah; dalam pembuktian kompleksitas pohon AVL, model menyelesaikan pembuktian terkait setelah menalar lebih dari 2,7 juta token dan 22 kompresi konteks. Selain pembuktian matematika, Leanstral 1.5 juga telah digunakan untuk verifikasi kode. Tim menemukan 11 bug nyata di 57 repositori Rust sumber terbuka, lima di antaranya belum pernah dilaporkan sebelumnya.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan