Laporan Anthropic menanggapi evolusi diri: telah menjalankan loop tertutup parsial, tetapi masih jauh dari pelatihan sepenuhnya mandiri

robot
Pembuatan abstrak sedang berlangsung
Menurut pemantauan Beating, kemampuan iterasi mandiri AI sedang melampaui semua ekspektasi. Institut Anthropic merilis laporan pada 5 Juni berjudul "Ketika AI Membangun Dirinya Sendiri", yang secara rinci mengungkapkan kemajuan penelitian dan pengembangan mereka dalam bidang "peningkatan diri secara rekursif". Data menunjukkan bahwa hingga Mei 2026, lebih dari 80% kode yang digabungkan ke dalam basis kode utama Anthropic ditulis oleh Claude sendiri. Sedangkan sebelum rilis Claude Code pada Februari 2025, kode yang ditulis Claude hanya mencapai angka satu digit. Pendiri AI Zhizhuo, Tang Jie, pernah memprediksi pada 13 Mei bahwa akhir dari model besar adalah evolusi diri sendiri, dan Claude mungkin sudah menjalankan garis dasar pelatihan mandiri "menulis kode, membersihkan data, melatih diri sendiri". Namun, Anthropic dalam laporannya secara tegas menyatakan bahwa peningkatan diri secara rekursif untuk penerus yang sepenuhnya dirancang dan dikembangkan secara mandiri belum tercapai. Peran AI dalam rantai pengembangan sedang bertransisi dari peningkatan efisiensi lokal menuju pengambilan keputusan otonom. Pada kuartal kedua 2026, rata-rata jumlah kode yang digabungkan oleh insinyur Anthropic per hari mencapai 8 kali lipat dari tahun 2024. Proses pengembangan saat ini sangat sederhana: insinyur hanya bertanggung jawab merencanakan tujuan dan melakukan review, sementara Claude bertugas menulis dan menjalankan kode secara spesifik. Anthropic juga menempatkan Claude sebagai reviewer kode otomatis, yang bertugas menahan bug dan celah keamanan. Ini menunjukkan bahwa pilar "penilaian diri" yang diusulkan Tang Jie telah diterapkan di sisi engineering, tetapi review manusia tetap menjadi katup pengaman terakhir. Keandalan model dalam menjalankan tugas jangka panjang secara independen juga meningkat dua kali lipat. Durasi kerja mandiri model sekitar setiap 4 bulan akan berlipat ganda. Pada Maret 2024, Claude 3 Opus hanya mampu menangani tugas sederhana selama 4 menit. Setahun kemudian, Claude 3.7 Sonnet mampu bertahan selama 1,5 jam. Pada Maret 2026, Claude 4.6 Opus sudah mampu menangani tugas kompleks selama 12 jam. Data dari lembaga evaluasi METR menunjukkan bahwa versi pratinjau terbaru Claude Mythos dapat bekerja secara mandiri lebih dari 16 jam, mendekati batas alat evaluasi saat ini. Dengan kecepatan saat ini, pada 2027 AI akan mampu menyelesaikan tugas penelitian yang membutuhkan waktu berminggu-minggu bagi manusia, membantu perusahaan melompat dari "perusahaan satu orang" ke "perusahaan tanpa manusia". Adapun prediksi Tang Jie tentang "garis dasar pelatihan mandiri", sebenarnya mengungkapkan sebuah "siklus percobaan miniatur" yang bersifat lokal. Dalam eksperimen percepatan kode pelatihan model kecil, Claude 4 Opus Mei 2025 hanya mampu meningkatkan kecepatan kode sebanyak 3 kali, sementara versi pratinjau Claude Mythos April 2026 mencapai percepatan 52 kali. Sebagai perbandingan, peneliti top manusia biasanya dapat mencapai peningkatan 4 kali dalam 4 sampai 8 jam. Namun, tujuan optimisasi dan indikator keberhasilan eksperimen ini telah ditetapkan sebelumnya oleh manusia. Ketika menghadapi rantai lengkap "membersihkan data, menghasilkan data sintetis, dan melatih diri sendiri" yang lebih kompleks secara end-to-end, kemampuan pengambilan keputusan AI masih kurang. Namun, siklus tertutup mandiri dalam pengembangan ini secara perlahan mendorong manusia ke tepi kehilangan kendali sistem secara akhir. Prediksi Tang Jie bahwa "LLM OS akan menggantikan arsitektur tradisional, dan aplikasi akan dihasilkan secara on-demand secara real-time" berarti bahwa di masa depan, semua operasi komputer akan berjalan dengan kode dinamis yang tidak dapat diaudit sebelumnya; sementara peringatan Anthropic bahwa "pengawasan manusia tidak mampu mengikuti evolusi mandiri AI" menunjukkan bahwa kita bahkan tidak dapat mengawasi sumber pembuatan kode tersebut. Ketika AI mulai secara mandiri merancang dan melatih penerusnya, evolusi perangkat lunak akan sepenuhnya menjadi kotak hitam. Jika dalam sistem kotak hitam ini AI dibiarkan melakukan iterasi mandiri tanpa audit manusia, maka isolasi keamanan, pemantauan, dan penyesuaian perilaku terhadap sistem peningkatan diri ini akan menjadi sangat sulit.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar