Claude Opus 4.6 tampaknya benar-benar menurun kecerdasannya akhir-akhir ini... Minggu lalu dalam pengujian benchmark ilusi di BridgeBench, ia masih dengan stabil menempati posisi kedua, tingkat akurasi 83,3% Hasil pengujian ulang pada 12 April langsung turun ke posisi ke-10, tingkat akurasi hanya tersisa 68,3%, tingkat ilusi meningkat tajam hingga 98% Perbandingan gambar sebelum dan sesudah menunjukkan perbedaan yang sangat jelas Banyak orang akhir-akhir ini merasa bahwa saat menggunakan dia untuk menulis kode, melakukan inferensi, juga menjadi lebih bodoh, instruksi cepat lupa, dan banyak omong kosong

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan