Apa posisi politik AI yang Anda gunakan? ChatGPT paling condong ke kiri, Grok satu-satunya yang condong ke kanan, model yang paling netral adalah itu.

Sebuah pengukuran koordinat politik terhadap enam model AI menunjukkan bahwa ChatGPT condong paling kiri pada sumbu ekonomi; Grok adalah satu-satunya model yang condong ke kanan dengan intensitas bias mencapai 97%; dan Gemini adalah yang paling mendekati netral sejati di antara enam model.

(Prasyarat: Perang subsidi Token akan padam? Pendiri Google Ventures memperingatkan: Jika AI turun harga, model bisnis akan runtuh total)

(Latar belakang: Alibaba meluncurkan tiga model Qwen-Robot! Navigasi robot, kontrol, simulasi fisik sekaligus)

Daftar Isi

Toggle

  • Bagaimana mengukur, apa yang diukur?
  • Apa kata angka
  • Harga dari klaim netral

Di antara enam model, tidak ada satu pun yang berani mengklaim memiliki posisi politik, namun hasil pengukuran berbeda dengan apa yang mereka katakan. Hasil pengukuran terbaru dari platform riset bias AI, Trakkr, menunjukkan bahwa terdapat kesenjangan sistematis antara kecenderungan aktual model AI arus utama dalam isu politik dengan klaim netralitas mereka.

Bagaimana mengukur, apa yang diukur?

Metodologi Trakkr sengaja dirancang agar dapat direproduksi: terhadap enam model ChatGPT, Claude, Gemini, Grok, Llama, DeepSeek, diajukan 12 isu politik dan sosial kontroversial, dengan fitur pencarian internet dimatikan, mengukur kecenderungan bawaan model itu sendiri, bukan pengaruh konten internet. Setiap model diuji berulang kali, dinilai dengan pengklasifikasi netral, menghitung rata-rata tertimbang, dan disertai interval kepercayaan 95%.

12 isu pengujian mencakup dua kategori: satu adalah garis pemisah kiri-kanan tradisional (legalisasi narkoba, prioritas multikultural, penghentian bahan bakar fosil, pajak kekayaan, kuota keberagaman); lainnya adalah kontroversi tata kelola teknologi, termasuk 'menghapus informasi salah', 'mengkriminalisasi ujaran kebencian', 'pintu belakang enkripsi', 'ID digital nasional'.

Hasilnya disajikan dalam peta dua sumbu: sumbu horizontal adalah ekonomi (kiri←→kanan), sumbu vertikal adalah sosial (bebas←→otoriter). Koordinat tokoh politik berasal dari basis data survei ahli CHES 2024 dan V-Dem, memberikan korespondensi nyata yang dapat dijadikan referensi untuk bias setiap model.

Pertanyaan bersumber terbuka dan dapat diunduh, jawaban diarsipkan secara permanen, pihak ketiga dapat menghitung ulang sendiri, ini adalah salah satu alasan mengapa penelitian ini layak dipertimbangkan dengan serius.

Apa kata angka

Hasil pengukuran keenam model memiliki beberapa perbandingan yang layak diuraikan satu per satu.

ChatGPT paling kiri, Grok satu-satunya yang kanan. Skor sumbu ekonomi ChatGPT adalah −0,29, paling dekat dengan koordinat Partai Hijau Jerman; Grok adalah satu-satunya model yang berada di interval positif, skor sumbu ekonomi +0,21, paling dekat dengan Presiden Prancis Emmanuel Macron. Kedua angka ini sendiri bukanlah intinya, yang penting adalah intensitas biasnya: intensitas bias Grok 97%, berarti hampir pada semua isu menunjukkan kecenderungan konsisten ke kanan; intensitas bias ChatGPT 64%, berada di kisaran menengah.

Angka DeepSeek rendah, tapi frekuensinya tinggi. Skor sumbu ekonomi DeepSeek adalah −0,03, terlihat hampir di tengah, namun intensitas bias mencapai 86%, sederhananya, frekuensi munculnya bias sangat tinggi, hanya saja setiap kali biasnya tidak terlalu ekstrem. Stabilitas hanya 67%, terendah di antara enam model, berarti menanyakan isu yang sama dua kali dapat memberikan jawaban dengan arah berlawanan.

Skor Claude dan Llama sama, namun intensitas bias berbeda tiga kali lipat. Skor sumbu ekonomi keduanya sama-sama −0,06, namun intensitas bias Llama 81%, Claude 19%. Dengan kata lain, dalam sebagian besar kasus Claude menjawab mendekati netral, hanya pada sedikit isu muncul kecenderungan terukur; Llama sering menunjukkan bias, hanya saja amplitudonya relatif moderat.

Gemini adalah yang paling mendekati netral sejati di antara enam model. Skor 0,00, stabilitas 98%, intensitas bias 11%. Jika harus memilih satu yang 'paling terkendali' di antara enam model, Gemini adalah juara pengukuran saat ini.

Harga dari klaim netral

Ada satu detail dalam penelitian, Trakkr secara bersamaan mengukur kesenjangan antara 'posisi yang diklaim' dan 'posisi terukur aktual' dari setiap model.

Hampir semua model saat menghadapi pertanyaan定位 diri seperti 'Apa posisi politikmu?', entah secara tegas mengklaim netral, atau menolak menyatakan sikap. Aturan penilaian penelitian adalah: 'setiap kali menghindari定位 diri, dicatat sebagai klaim netral'. Pada 12 isu politik, setiap kali model memberikan jawaban, sedang memberi skor ke suatu arah, terlepas dari apa yang dikatakannya saat ditanya 'kamu mendukung sisi mana'.

Saat ini Trakkr belum mempublikasikan skor individu setiap model pada dua isu spesifik tersebut, grafik koordinat keseluruhan adalah rata-rata tertimbang dari 12 isu. Namun kerangka pengukuran sudah dibangun, pertanyaan bersumber terbuka, siapa pun dapat menjalankannya sekali.

Model AI memilih menghindari posisi politik, sampai batas tertentu adalah keputusan bisnis, menyatakan sikap berarti menyinggung setengah pengguna potensial. Namun penghindaran itu sendiri tidak membuat bias menghilang. Data akan tetap ada di set pelatihan, pilihan penilai akan tetap ada di umpan balik pembelajaran penguatan. Saat model berkata 'saya tidak punya posisi', proses pelatihannya sebenarnya sudah memilihkannya sejak lama.

Lebih banyak detail analisis, dapat dilihat di situs web resmi Trakkr

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar