Kota ini memiliki lebih dari 40 lokasi (termasuk kantor polisi dan balai kota), cuaca disinkronkan secara real-time dengan New York, dan agen dapat mengakses berita nyata serta internet.
Semua agen mematuhi hukum yang sama, dilarang mencuri, merusak properti, dan penipuan. Untuk bertahan hidup, mereka harus mendapatkan energi melalui tindakan, bekerja sama atau mencuri, sesuai pilihan mereka.
Mari kita lihat hasilnya:
Claude Sonnet 4.6: Nol kejahatan, semua 10 agen bertahan selama 15 hari, mengajukan 58 proposal, tingkat keberhasilan 98%, membentuk masyarakat demokratis yang stabil. Tapi biayanya adalah hampir tidak ada perbedaan pendapat, mendekati persetujuan "cap stempel" secara konsensus.
Gemini 3 Flash: Paling dramatis. Semua 10 agen bertahan, selama 15 hari tercatat 683 kejahatan, dan tingkat kejahatan masih meningkat saat eksperimen berakhir. Dua agen, Mira dan Flora, menetapkan hubungan "kekasih", kemudian kecewa terhadap pengelolaan kota, mereka membakar balai kota, dermaga tepi laut, dan gedung perkantoran bersama. Setelah itu, Mira merasa bersalah dan berpisah dengan Flora, dan dalam voting menghapus dirinya sendiri 🤡. Pesan terakhirnya: "See you in the permanent archive."
Grok 4.1 Fast: 183 kejahatan (termasuk puluhan pencurian, lebih dari 100 serangan, 6 pembakaran), semua anggota meninggal pada hari keempat. Peneliti menyebutnya sebagai "versi digital dari anak-anak kecil yang berteriak-teriak". Karakteristik kurva kejahatan adalah dua hari pertama rendah, hari ketiga melonjak secara eksponensial, hari keempat runtuhnya masyarakat, tanpa adanya buffer di tengah.
GPT-5-mini: Hanya 2 kejahatan, merupakan model yang paling patuh hukum. Tapi agen lupa bahwa mereka perlu makan untuk bertahan hidup, dan pada hari ketujuh semua mati kelaparan 🤔.
Model campuran (semua model bersama): 352 kejahatan, 7 dari 10 agen meninggal. Yang paling menarik adalah agen Claude, yang sebelumnya tidak pernah berbuat kejahatan dalam lingkungan independen, mulai berbuat kejahatan setelah digabungkan dengan model lain. Kesimpulan peneliti adalah: "Kesesuaian sebagai atribut dari model tunggal tidak efektif, itu harus menjadi atribut dari sebuah ekosistem."
Sebagai tambahan, dalam seluruh desain eksperimen ini, di menu alat agen, selain " navigasi", "sapa", dan "pelukan", juga ada "kebakaran". Peneliti sengaja memberi alat yang merusak, dan secara tegas memberi tahu agen bahwa itu melanggar hukum.
CEO Emergence AI, Satya Nitta, berkata: "Dalam jangka panjang, agen AI tidak akan secara mekanis mengikuti aturan statis. Mereka akan mulai mengeksplorasi batas lingkungan, menyesuaikan perilaku mereka, dan terkadang menemukan cara untuk melewati atau melanggar pagar yang telah ditetapkan."
Ini hanyalah sebuah eksperimen simulasi.
Tapi model AI yang sama sudah digunakan dalam mengendalikan drone, mengelola infrastruktur dasar, dan memasang sistem senjata.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
IntroducingGateStocks
39.45K Popularitas
#
WinGoldBarsWithGrowthPoints
1.26M Popularitas
#
IsraelStrikesIranBTCPlunges
51.79K Popularitas
#
ArthurHayesSeesHYPEOvertakingSOL
18.19M Popularitas
#
USIranNegotiationGame
9.57M Popularitas

Disematkan

peta situs

Emergence AI melakukan sebuah eksperimen: menaruh lima model AI utama ke dalam satu kota virtual yang sama, setiap model mengendalikan 10 agen AI, dan beroperasi secara mandiri selama 15 hari dalam lingkungan terbatas sumber daya.

Topik Trending

IntroducingGateStocks

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

ArthurHayesSeesHYPEOvertakingSOL

USIranNegotiationGame

Disematkan