Wenxin 5.1 resmi diluncurkan: parameter dipangkas menjadi sepertiga dari 5.0, biaya pra-pelatihan hanya 6% dari rekan sejawat

Menurut pemantauan Beating, model besar Baidu Wenxin 5.1 resmi diluncurkan, pengguna dapat merasakannya di situs resmi Wenxin Yiyan, dan perusahaan serta pengembang dapat mengakses API melalui platform Qianfan. Wenxin 5.1 didasarkan pada Wenxin 5.0 yang dirilis pada Januari tahun ini, dengan keunggulan utama berupa kompresi besar-besaran ukuran model dan biaya pelatihan: jumlah parameter total dikompresi menjadi sekitar sepertiga dari 5.0, parameter aktif sekitar separuhnya, dan biaya komputasi pra-pelatihan hanya 6% dari model dengan skala yang sama.
Kompresi biaya berasal dari kerangka pelatihan elastis Once-for-All yang diajukan oleh Baidu. Pendekatan tradisional memerlukan pelatihan pra-model berbeda untuk berbagai skala model, tetapi Wenxin 5.0 hanya melakukan satu kali pra-pelatihan, dan melalui sampling dinamis dapat mengoptimalkan banyak sub-model dengan ukuran berbeda secara bersamaan. Wenxin 5.1 adalah struktur optimal yang diambil dari matriks sub-model ini, secara langsung mewarisi pengetahuan dari 5.0, menghemat biaya komputasi dari pelatihan dari awal.
Sebelumnya, pada 30 April, versi Preview Wenxin 5.1 telah meraih skor 1476 di peringkat teks LMArena dan mendapatkan posisi pertama di dalam negeri. Versi resmi semakin meningkatkan hasilnya dalam pengujian standar: skor 99,6 pada kompetisi matematika AIME26 (menggunakan alat), hanya kalah dari Gemini-3.1 Pro; kemampuan Agent melebihi DeepSeek-V4-Pro; dan peringkat Arena Search dengan skor 1223 menempati posisi keempat secara global dan posisi pertama di dalam negeri.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan