Model 27B parameter berjalan di GPU dengan memori 16GB, diklaim memiliki kemampuan inferensi mendekati Claude 4 Opus

robot
Pembuatan abstrak sedang berlangsung

Berita ME: Pada 1 April (UTC+8), baru-baru ini beredar kabar bahwa sebuah model dengan skala parameter 27B, saat dijalankan secara kuantisasi 4-bit pada GPU dengan memori 16GB di lokal, menunjukkan performa yang lebih baik daripada Claude Sonnet 4.5 pada benchmark SWE-bench. Menurut pandangan di artikel tersebut, model ini dapat memberikan kemampuan penalaran yang sebanding dengan Claude 4 Opus, namun dengan kebutuhan sumber daya yang lebih rendah. Versi v2 dari model ini telah mengurangi redundansi penalaran berantai (chain-of-thought) sebesar 24%, sekaligus mempertahankan akurasi HumanEval sebesar 96,91%. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan