GPT-5.5「9.7T parameter」 telah diperiksa kembali: setelah diperbaiki hanya tersisa sekitar 1.5T

robot
Pembuatan abstrak sedang berlangsung

Berita dari CoinWorld, peneliti AI Lawrence Chan dan Benno Sturgeon melakukan tinjauan ulang terhadap makalah Chief Scientist Pine AI Li Bojie berjudul “Detektor Pengetahuan Tak Terkompresi: Estimasi Kapasitas Fakta pada Parameter Model Bahasa Hitam Kotak”. Makalah asli memperkirakan GPT-5.5 sekitar 9,7T, Claude Opus 4.7 sekitar 4,0T, O1 sekitar 3,5T. Tinjauan ulang menunjukkan bahwa angka asli diperbesar karena kriteria penilaian dan kualitas soal, terutama penanganan “skor lantai” yang tidak tepat, yang menyebabkan perbedaan performa model pada soal sulit dibesar-besarkan. Setelah menghapus “skor lantai”, kemiringan fitting turun dari 6,79 menjadi 3,56, r² turun dari 0,917 menjadi 0,815, interval prediksi 90% dari 3,0 kali diperbesar menjadi 5,7 kali, menunjukkan peningkatan kesalahan. Tinjauan ulang juga menemukan 131 soal memiliki ambiguitas atau jawaban salah, sebesar 9,4%. Berdasarkan data yang telah diperbaiki, parameter GPT-5.5 turun dari 9659B menjadi 1458B, interval prediksi 90% berkisar antara 256B hingga 8311B, penulis tinjauan menegaskan bahwa 1,5T tidak dapat dianggap sebagai jumlah parameter nyata GPT-5.5.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan