2930 langkah vs 2990 langkah, apakah ini benar-benar pembelajaran mandiri dari Opus atau hanya gabungan tingkat tinggi?

Lihat Asli
MeNews
Membakar 14.000 jam kekuatan komputasi H200, Claude Opus memecahkan rekor nanoGPT
AIMPACT Pesan, 15 Mei (UTC+8), menurut pemantauan Beating dari Dongcha, Prime Intellect mengumumkan sebuah eksperimen penelitian AI otonom selama dua minggu. Tim penelitian membiarkan Codex (gpt 5.5 xhigh) dan Claude Code (opus 4.7 xhigh) secara mandiri melakukan iterasi solusi optimizer dalam perlombaan kecepatan nanoGPT, berusaha mencapai kerugian verifikasi target dengan langkah paling sedikit. Setelah sekitar 10.000 percobaan dan menghabiskan 14.000 jam kekuatan komputasi H200, Opus akhirnya memecahkan rekor manusia dengan 2930 langkah dibandingkan 2990 langkah. Eksperimen ini mengungkap batas kemampuan agen AI saat ini. Dalam cabang pengujian yang secara tegas menuntut algoritma baru, kedua model tidak mampu menjalankan tanpa kode atau makalah yang sudah ada dari komunitas manusia.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan