Model 27B parameter berjalan di GPU dengan memori 16GB, diklaim memiliki kemampuan inferensi mendekati Claude 4 Opus

robot
Pembuatan abstrak sedang berlangsung

Pesan ME News pada 1 April (UTC+8). Belakangan ini, beredar kabar bahwa sebuah model dengan skala parameter 27B dapat berjalan secara kuantisasi 4-bit pada GPU lokal dengan memori video (VRAM) 16GB, dan menunjukkan kinerja yang lebih baik pada benchmark SWE-bench dibandingkan dengan Claude Sonnet 4.5. Menurut pandangan dalam artikel tersebut, model ini dapat memberikan kemampuan penalaran yang setara dengan Claude 4 Opus, namun dengan kebutuhan sumber daya yang lebih rendah. Versi v2 model ini mengurangi redundansi pada chain-of-thought sebesar 24%, sambil mempertahankan akurasi HumanEval sebesar 96.91%. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan