智谱GLM-5.2 menjadi yang terdepan dalam indeks kecerdasan AA sumber terbuka: GDPval bersaing setara dengan GPT-5.5

robot
Pembuatan abstrak sedang berlangsung
Laporan dari Jinse Finance, model flagship MoE terbaru dari Zhipu AI GLM-5.2 meraih skor 51 dalam penilaian indeks kecerdasan model besar Artificial Analysis v4.1, mengalahkan MiniMax-M3 (44 poin), DeepSeek V4 Pro (max, 44 poin), dan Kimi K2.6 (43 poin), menduduki puncak daftar model sumber terbuka global.
Dalam pengujian GDPval-AA v2 yang mensimulasikan pekerjaan pengetahuan dunia nyata, GLM-5.2 mendapatkan 1524 poin (skor standar manusia 1000 poin), unggul atas MiniMax-M3 (1418 poin) dan DeepSeek V4 Pro (max, 1328 poin), serta seimbang dengan model besar tertutup terdepan GPT-5.5 (xhigh reasoning). Dibandingkan pendahulunya GLM-5.1, penalaran ilmiah CritPt meningkat 16 poin persentase menjadi 21%, HLE meningkat 12 poin persentase menjadi 40%, TerminalBench v2.1 meningkat 16 poin persentase menjadi 78%, dan GPQA Diamond mencapai 89%.
GLM-5.2 menempati posisi terbaik dari segi rasio biaya-performa di garis depan Pareto "Kecerdasan - Biaya Tugas". Karena output rata-rata per tugas mencapai 43 ribu token (dibandingkan 26 ribu token dari GLM-5.1), biaya rata-rata per tugas GLM-5.2 meningkat menjadi sekitar 0,46 dolar AS, lebih tinggi dari GLM-5.1 (0,25 dolar) dan DeepSeek V4 Pro (max, 0,05 dolar), tetapi tetap jauh lebih rendah dari model tertutup selevel kecerdasan yang sama.
GLM-5.2 memiliki total parameter 744 miliar, parameter aktif 40 miliar, jendela konteks meningkat dari 200 ribu menjadi 1 juta, mengikuti lisensi MIT dan bersifat open source. Saat ini, API resmi Zhipu (harga input 1,4, output 4,4 / per juta token) telah tersedia di platform seperti SiliconFlow, DeepInfra, Nebius AI, dan lainnya.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan