GLM-5.2 sumber terbuka dengan rasio biaya-keuntungan yang luar biasa, biayanya kurang dari seperempat Opus 4.8, tetapi hanya selisih 90 poin, penilaian ini membuat saya langsung bilang "benar-benar keren"

Lihat Asli
CoinNetwork
AA-Briefcase dirilis: Claude Fable 5 juara, GLM-5.2 masuk tiga besar
Artificial Analysis meluncurkan standar evaluasi pengetahuan jangka panjang pertama untuk agen kecerdasan model besar, mencakup empat skenario: ilmu data, manajemen produk, operasi perbankan, dan strategi industri berat, dengan 91 tugas yang dikembangkan oleh para ahli dari Google, McKinsey, dan Boston Consulting. Hasilnya menunjukkan bahwa Claude Fable 5 meraih juara, Opus 4.8 berada di urutan kedua, dan GLM-5.2 menempati tiga besar; tetapi di bawah standar kesempurnaan untuk setiap item, tingkat keberhasilan Fable 5 hanya 3%. Skor gabungan dari GLM-5.2 yang bersifat open-source hanya 90 poin lebih rendah dari Opus 4.8, tetapi biayanya kurang dari 25%.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan