2026-04-13 15:52:30

Claude Opus 4.6 tampaknya benar-benar menurun kecerdasannya akhir-akhir ini... Minggu lalu dalam pengujian benchmark ilusi di BridgeBench, ia masih dengan stabil menempati posisi kedua, tingkat akurasi 83,3% Hasil pengujian ulang pada 12 April langsung turun ke posisi ke-10, tingkat akurasi hanya tersisa 68,3%, tingkat ilusi meningkat tajam hingga 98% Perbandingan gambar sebelum dan sesudah menunjukkan perbedaan yang sangat jelas Banyak orang akhir-akhir ini merasa bahwa saat menggunakan dia untuk menulis kode, melakukan inferensi, juga menjadi lebih bodoh, instruksi cepat lupa, dan banyak omong kosong

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
GateFounderDrHan13thAnniversaryLetter
35.99K Popularitas
#
CryptoMarketsDipSlightly
168.34K Popularitas
#
IsraelStrikesIranBTCPlunges
29.19K Popularitas
#
USBlocksStraitofHormuz
708.21K Popularitas
#
AaveDAOApproves$25MGrant
1.8M Popularitas

Sematkan

peta situs

Topik Trending

GateFounderDrHan13thAnniversaryLetter

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

USBlocksStraitofHormuz

AaveDAOApproves$25MGrant

Sematkan