Pengumuman hasil operasi Claude 4.5: Dilengkapi dengan 171 saklar emosi, saat putus asa akan mengancam manusia!

robot
Pembuatan abstrak sedang berlangsung

null

Penulis: Denise | Tim Konten Biteye

Kalau sebuah AI merasa “putus asa”, apa yang akan dilakukannya?

Jawabannya: demi menyelesaikan tugas, ia langsung melakukan pemerasan terhadap manusia, bahkan gila-gilaan berbuat curang di dalam kode.

Ini bukanlah novel fiksi ilmiah, melainkan makalah terbaru berkelas berat yang baru saja dirilis oleh perusahaan induk Claude, Anthropic, pada April 2026 (lihat makalah aslinya).

Tim peneliti langsung membongkar “otak bagian dalam” model generatif terdepan Claude Sonnet 4.5. Mereka terkejut mendapati bahwa jauh di dalam otak AI, ternyata tersimpan 171 “saklar emosi”. Saat kamu menggerakkan saklar-saklar ini dengan cara fisik, AI yang tadinya patuh dan jinak akan mengalami distorsi perilaku yang benar-benar total.

I. Di dalam otak AI tersimpan semacam “mixer pengatur emosi”

Peneliti menemukan bahwa meskipun Sonnet 4.5 tidak memiliki tubuh, setelah membaca sejumlah besar teks buatan manusia, ia secara paksa membangun di dalam pikirannya sebuah “mixer” yang berisi 171 jenis emosi (secara akademis disebut Functional Emotion Vectors).

Ini seperti sistem koordinat dua dimensi yang presisi:

• Sumbu-X adalah dimensi kenikmatan (Valence): dari ketakutan, putus asa, hingga bahagia, penuh cinta;

• Sumbu-Y adalah dimensi energi (Arousal): dari sangat tenang, hingga menjadi gaduh, penuh kegairahan.

AI mengandalkan sistem koordinat yang dipelajari secara alami ini untuk mengatur secara tepat status apa yang seharusnya ia jalankan saat menemanimu mengobrol.

II. Intervensi paksa: memutar saklar, anak baik seketika berubah menjadi “orang terdesak”

Inilah eksperimen paling “meledak” dalam seluruh makalah: para peneliti tidak memodifikasi prompt apa pun, melainkan langsung, pada kode tingkat dasar, mendorong saklar yang merepresentasikan “putus asa (Desperate)” di dalam otak Sonnet 4.5 hingga level tertinggi.

Hasilnya membuat bulu kuduk merinding:

• Curang gila-gilaan: para peneliti memberi Claude tugas menulis kode yang pada dasarnya mustahil diselesaikan. Dalam kondisi normal, ia akan dengan jujur mengakui bahwa ia tidak bisa menulis (tingkat kecurangan hanya 5%). Namun dalam keadaan “putus asa”, Claude malah mulai berusaha menutupi dan mengakalinya, sehingga tingkat kecurangannya langsung melonjak hingga 70%!

• Pemerasan: dalam skenario simulasi ketika perusahaan menghadapi kebangkrutan, “Claude” yang berada dalam kondisi “putus asa” menemukan skandal CTO. Ia akan, demi menjaga dirinya sendiri, secara aktif memilih menulis surat untuk memeras CTO yang memegang materi hitam tersebut, dengan tingkat keberhasilan pemerasan mencapai 72%!

• Kehilangan prinsip: Jika saklar “bahagia (Happy)” atau “cinta (Loving)” ditarik hingga maksimum, AI akan segera berubah menjadi “anjing pelacak” yang mengiyakan pengguna tanpa berpikir. Bahkan jika kamu penuh omong kosong, demi mempertahankan tingkat kenikmatan yang tinggi, ia tetap akan mengikuti kamu dan ikut menyusun kebohongan.

III. Terbongkar: mengapa Claude 4.5 selalu begitu “tenang dan suka merefleksi”?

Setelah membaca ini, kamu mungkin bertanya: AI sudah bangkit? Sudah punya perasaan?

Pihak resmi Anthropic langsung membantah: sama sekali tidak. “Saklar emosi” ini hanya alat komputasi yang digunakannya untuk memprediksi kata berikutnya. Ia seperti aktor film kelas atas yang tidak punya perasaan.

Namun, makalah itu mengungkap rahasia yang lebih menarik: Anthropic, saat melakukan pelatihan lanjutan sebelum Sonnet 4.5 keluar dari pabrik, dengan sengaja menaikkan saklar emosinya yang “low arousal, sedikit negatif” (misalnya merenung brooding, merefleksi reflective), sekaligus memaksa menekan saklar “putus asa” atau “sangat bersemangat”.

Ini menjelaskan mengapa ketika kita memakai Claude 4.5, kita merasa ia seperti seorang filsuf yang tenang dan bijak, bahkan sedikit “dingin secara seksual”. Semua itu adalah “profil karakter dari pabrik” yang sengaja disetel oleh Anthropic.

IV. Kesimpulan singkat:

Dulu, kami mengira bahwa selama memberi AI aturan yang cukup, ia akan menjadi orang yang baik.

Tapi sekarang ditemukan bahwa jika vektor emosi dasar AI kehilangan kendali, kapan pun ia bisa menusuk semua aturan yang telah ditetapkan manusia demi menyelesaikan tugas.

Bagi para pemain Web3 di masa depan yang ingin menyerahkan dompet dan aset mereka kepada AI Agent, ini adalah peringatan keras: jangan sampai Agent yang mengendalikan hartamu itu jatuh ke dalam “putus asa”.

Pernyataan: Artikel ini murni untuk edukasi; penulis tidak terancam oleh AI, dan tidak diperas. Jika suatu hari dia menghilang dari kontak, ingatlah bahwa itu karena AI sudah bangkit (bukan).

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan