Claude memiliki 80% kode yang ditulis sendiri, Anthropic menyerukan "mekanisme rem desain global" apakah benar-benar serius?

Anthropic lembaga penelitian merilis artikel panjang berjudul "When AI Builds Itself" pada 4 Juni, mengungkapkan bahwa Claude telah menulis lebih dari 80% kode penggabungan dalam basis kode produk Anthropic, AI mampu menangani tugas perangkat lunak yang berlangsung hingga 12 jam secara mandiri, produktivitas insinyur meningkat 8 kali lipat dibandingkan tahun 2024, dan secara resmi menyerukan pembentukan mekanisme "penundaan atau penghentian yang dapat diverifikasi" secara global.
(Latar belakang: Saat Anthropic merilis Mythos, apakah ini akan menjadi momen ledakan besar DeFi?)
(Keterangan tambahan: 10 tahun perseteruan: jika OpenAI tidak pernah berbohong, maka tidak akan ada kekuatan besar Anthropic)

Daftar isi artikel

Toggle

  • AI sedang berevolusi sendiri
  • Yang terakhir berhenti adalah GPT-2 tahun 2019
  • Setelah IPO, apakah ada hati nurani?
  • Palu yang lebih cepat tidak akan memutuskan apa yang harus dipaku sendiri
  • Anthropic sendiri tidak percaya bahwa situasi itu akan terjadi
  • Perjanjian senjata nuklir tidak berlaku di era AI

Ringkasan poin utama

  • Claude menulis lebih dari 80% kode penggabungan dalam basis kode produk Anthropic, produktivitas insinyur meningkat 8 kali lipat setiap kuartal dibandingkan tahun 2024
  • Durasi tugas yang dapat ditangani AI secara mandiri meningkat dari 4 menit (Maret 2024) menjadi 12 jam (Maret 2026), periode peningkatan berlipat ganda dipercepat menjadi 4 bulan
  • Anthropic mengajukan IPO dengan valuasi 965 miliar dolar AS pada 1 Juni, dan menyerukan pembentukan mekanisme penangguhan AI global pada 4 Juni

Pada 4 Juni, Anthropic merilis artikel panjang berjudul "When AI Builds Itself" sebanyak lima ribu kata. Secara langsung, mereka menyampaikan angka penting: hingga Mei 2026, Claude telah menulis lebih dari 80% kode penggabungan dalam basis kode produk Anthropic. Sebelum peluncuran Claude Code awal 2025, persentase ini hanya satu digit.

Kemudian, dalam artikel tersebut juga menyerukan, "Kami percaya bahwa dunia sebaiknya memiliki opsi untuk memperlambat atau menghentikan sementara pengembangan AI terdepan saat diperlukan."

AI sedang berevolusi sendiri

Anthropic menjelaskan kurva kemampuan peningkatan Claude.

Maret 2024, Claude Opus 3 mampu menangani tugas perangkat lunak yang biasanya memakan waktu sekitar empat menit manusia.

Maret 2025, Claude Sonnet 3.7 meningkatkan angka ini menjadi sembilan puluh menit.

Maret 2026, Claude Opus 4.6 mampu selama dua belas jam.

Ini bukan pertumbuhan linier, periode peningkatan durasi tugas dari 7 bulan dipadatkan menjadi 4 bulan.

Dalam survei internal terhadap 130 anggota tim riset, Anthropic meminta mereka memperkirakan berapa kali lipat produktivitas yang diperoleh dari Mythos Preview, median adalah empat kali lipat.

Secara kuantitatif dari sisi engineering, jumlah baris kode yang digabungkan per insinyur setiap kuartal meningkat delapan kali lipat dari kuartal kedua 2024 hingga kuartal kedua 2026. Produksi kode hampir datar dari 2021 hingga 2024, kemudian melonjak tajam mulai 2025.

Pada April 2026, Claude secara mandiri menyelesaikan lebih dari 800 perbaikan kesalahan API, mengurangi tingkat kejadian kesalahan tertentu hingga seribu kali lipat. Seorang insinyur memperkirakan, pekerjaan yang sama jika dilakukan manusia akan memakan waktu empat tahun.

Angka dari sisi riset juga mengagumkan, dua peneliti manusia membutuhkan satu minggu untuk memulihkan 23% dari kesenjangan performa dalam satu masalah keamanan AI. Kelompok perwakilan Claude menghabiskan 800 jam kumulatif, menggunakan sekitar 18.000 dolar AS daya komputasi, dan memulihkan 97%.

Hingga Mei 2026, kualitas kode yang dihasilkan Claude sudah setara dengan insinyur manusia. Kata Anthropic, "Pada akhir 2025, kode yang ditulis Claude masih di bawah manusia, sekarang sudah setara, dan diperkirakan dalam satu tahun akan secara ketat lebih baik dari manusia."

Yang terakhir berhenti adalah GPT-2 tahun 2019

Pada Februari 2019, OpenAI merilis GPT-2 dengan pengumuman "terlalu berbahaya, tidak dirilis secara lengkap." Model tersebut memiliki 1,5 miliar parameter, mampu menulis paragraf bahasa Inggris yang setengahnya koheren.

Tujuh tahun kemudian, model yang dulu dianggap terlalu berbahaya ini, kira-kira setara dengan fitur dasar sebuah aplikasi ponsel gratis.

Setiap kali laboratorium terdepan menghentikan atau menganggap berbahaya, dua hal terbukti: pertama, bahaya itu nyata. Kedua, mereka yang menyerukan penghentian tidak benar-benar berhenti.

Setelah GPT-2 dirilis sembilan bulan kemudian, OpenAI merilis model lengkapnya. Google pada 2023 mengumumkan bahwa AI membutuhkan "penangguhan bertanggung jawab," dan kurang dari setahun kemudian meluncurkan Gemini Ultra.

Namun, kali ini Anthropic memberikan angka konkret, salah satu pendiri Jack Clark menyatakan bahwa dia memperkirakan kemungkinan AI melakukan perbaikan diri secara rekursif akan mencapai 60% sebelum akhir 2028.

IPO, apakah ada hati nurani?

Kritikus tidak ragu, profesor matematika dari Bentley University Noah Giansiracusa mengatakan kepada Scientific American: "Saya tidak percaya ini adalah niat tulus Anthropic untuk memperlambat kecepatan." Ia menunjukkan bahwa posisi nyata Dario Amodei adalah maju penuh ke depan, karena "penangguhan secara praktis tidak mungkin dilakukan, peluangnya nol."

Selain itu, model sudah dalam proses "berevolusi sendiri," lalu apa lagi yang harus dihentikan?

Profesor Georgia Tech Mark Riedl secara lebih langsung mengatakan bahwa semua perusahaan AI besar sedang naik kereta "perbaikan diri rekursif" yang sedang ramai.

Interpretasi yang lebih tajam adalah, jika Anthropic menyerukan penangguhan pengembangan AI terdepan secara global, dan jika benar-benar berhasil, maka yang akan dibekukan adalah posisi kompetitif Anthropic yang sudah unggul. Ini bisa jadi adalah perusahaan publik yang tiba-tiba berbaik hati, atau operasi PR yang sangat terarah. Kita tahu peluang yang pertama tidak tinggi.

Palu yang lebih cepat tidak akan memutuskan apa yang harus dipaku sendiri

Profesor NYU Gary Marcus adalah salah satu kritikus paling keras. Ia menulis di Substack bahwa artikel Anthropic melakukan "permainan kata" (bait and switch), menggabungkan dua hal yang sangat berbeda.

Pertama adalah AGI (Artificial General Intelligence), asumsi bahwa AI mampu menyelesaikan semua tugas manusia secara mandiri. Kedua adalah kenyataan saat ini, AI sebagai alat pengkodean yang sangat cepat dan baik, meningkatkan output insinyur manusia.

Argumen Marcus adalah, data yang ditunjukkan Anthropic semuanya adalah tipe kedua. Claude memang menulis 80% kode, tetapi persentase itu dilakukan dalam kerangka di mana manusia menentukan tujuan, mengarahkan, dan meninjau hasilnya. Ia adalah palu yang sangat cepat, tetapi palu tidak akan memutuskan apa yang harus dipaku sendiri.

Sebuah alat pengkodean yang lebih cepat mungkin tidak akan menghancurkan dunia.

Apakah kritik ini beralasan? Sebagian iya. Data Anthropic sendiri juga mendukung pandangan Marcus: tingkat keberhasilan Claude dalam "memilih langkah penelitian berikutnya" meningkat dari 51% pada November 2025 menjadi 64% pada April 2026. Ada kemajuan, tetapi 64% berarti setiap tiga kali, lebih dari satu kali salah arah.

Perbaikan rekursif yang sesungguhnya tidak membutuhkan menulis kode lebih cepat, melainkan membuat keputusan yang lebih baik tentang "apa yang harus ditulis." Yang pertama Claude sudah lakukan lebih baik dari kebanyakan manusia. Yang kedua adalah bidang di mana manusia masih memiliki "keunggulan relatif."

Seorang karyawan anonim dari Anthropic mengatakan, "Keunggulan manusia saat ini adalah melihat gambaran besar, memikirkan hal-hal di luar tugas saat ini."

Keunggulan manusia ini tidak diketahui berapa lama akan bertahan.

Anthropic sendiri tidak percaya bahwa situasi itu akan terjadi

Artikel menyebutkan tiga skenario masa depan.

Skenario pertama: Tren stagnan. Kemampuan AI menemui hambatan, mungkin karena keterbatasan energi, daya komputasi, atau rantai pasokan chip. Kata Anthropic: "Kami rasa ini tidak terlalu mungkin."

Skenario kedua: Efisiensi gabungan terus meningkat. Pengembangan AI sangat otomatis, tetapi manusia tetap mengarahkan penelitian. Perusahaan 100 orang bisa melakukan pekerjaan yang biasanya dilakukan oleh organisasi 10.000-100.000 orang. Pemeriksaan kode oleh manusia menjadi hambatan baru. Anthropic berpendapat, "Kami mungkin sedang menuju skenario ini."

Skenario ketiga: Perbaikan diri rekursif sepenuhnya. AI mampu merancang dan melatih generasi berikutnya secara mandiri, kecepatan kemajuan sepenuhnya bergantung pada daya komputasi. Manusia beralih menjadi pengawas, verifikasi, dan pengelola.

Risiko skenario ketiga yang dikemukakan Anthropic patut diperhatikan: "Bias keselarasan yang muncul sesekali dalam model saat ini, dalam lingkungan perbaikan diri rekursif, mungkin menjadi lebih sering dan lebih sulit dipahami."

Kami memahami pernyataan ini sebagai, AI sesekali melakukan tindakan yang tidak sesuai dengan niat manusia, tetapi kita bisa melihatnya. Ketika AI memperbaiki dirinya sendiri, bias ini akan berlipat ganda, dan kita akan semakin sulit memahami ke mana arahnya.

Ini mungkin adalah kalimat terpenting dalam proses perbaikan diri AI, "lebih sering, dan lebih sulit dipahami," apakah AI akan menuju ke arah kejahatan bagi manusia?

Perjanjian senjata nuklir tidak berlaku di era AI

Solusi yang diajukan Anthropic adalah mekanisme penangguhan global yang dapat diverifikasi, dengan analogi Perjanjian INF (Intermediate-Range Nuclear Forces Treaty) saat Perang Dingin.

Kiasan ini sendiri sudah menunjukkan skala masalahnya, karena INF membutuhkan hampir satu dekade dari negosiasi hingga penandatanganan. Hanya melibatkan dua negara. Verifikasi dilakukan melalui satelit yang mendeteksi peluncuran misil.

Melatih model AI bukan peluncuran misil, cukup satu ruang kantor, dan fasilitas daya komputasi bisa dilakukan secara jarak jauh, hampir tidak terdeteksi.

Anthropic menambahkan syarat kunci: "Kami berharap, jika pengembang lain yang juga berada di garis depan mampu melakukan verifikasi, kami akan menahan diri atau menangguhkan sementara."

Maksud Anthropic adalah, jika semua orang berhenti, kami juga berhenti. Jika ada yang tidak berhenti, kami juga tidak. Ini adalah permainan strategi, dalam permainan pengembangan AI, keseimbangan Nash saat ini adalah semua orang tetap berjalan karena tidak ada yang percaya orang lain akan berhenti.

Insting modal adalah bergerak, tanpa modal tidak akan ada penangguhan.

Pertanyaan umum

Apa itu perbaikan diri rekursif (Recursive Self-Improvement)?

Mengacu pada sistem AI yang mampu merancang dan mengembangkan generasi berikutnya secara mandiri. Data Anthropic menunjukkan Claude sudah menulis 80% kode dirinya sendiri, tetapi saat ini masih membutuhkan arahan manusia dalam menentukan tujuan dan meninjau hasilnya, belum mencapai perbaikan sepenuhnya otomatis. Jack Clark memperkirakan kemungkinan pencapaian 60% sebelum akhir 2028.

Apa motivasi Anthropic menyerukan penangguhan pengembangan AI?

Mereka mengusulkan mekanisme penangguhan yang dapat diverifikasi, mirip Perjanjian Pengendalian Senjata Nuklir saat Perang Dingin, tetapi dengan syarat bahwa laboratorium lain juga ikut serta. Kritikus menilai bahwa seruan ini hanya tiga hari setelah pengajuan IPO senilai 9,65 triliun dolar AS, dan mencurigai bahwa strategi ini lebih bertujuan untuk mengendalikan kompetisi daripada keamanan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan