Sina merilis open source VibeThinker-3B: Penalaran dapat dikompresi, pengetahuan faktual tidak bisa.

robot
Pembuatan abstrak sedang berlangsung
ME News Berita, 28 Juni (UTC+8), Sina merilis VibeThinker-3B dengan hanya 3B parameter, setara dengan model DeepSeek V3.2 dan model lain yang 200-333 kali lebih besar pada tolok ukur matematika pemrograman seperti AIME26, LiveCodeBench melampaui semua model di bawah 20B, memecahkan 123/128 soal pada kompetisi LeetCode melebihi GPT-5.2, Kimi K2.5, dll. Namun pada GPQA-Diamond yang padat pengetahuan, tertinggal jauh. Model ini didasarkan pada Ali Qwen2.5-Coder-3B, melalui pelatihan multi-tahap seperti SFT, pembelajaran penguatan, dan distilasi diri. Penelitian mengajukan "Hipotesis Kompresi-Penutupan Parameter": penalaran logis bergantung pada sejumlah kecil pola yang dapat dikompresi, sementara pengetahuan dunia yang luas masih membutuhkan parameter besar. Model telah dirilis sebagai sumber terbuka. 🔗 Baca teks asli:
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar