Studi tentang Mekanisme Ketidaksesuaian antara Persepsi dan Tindakan dalam Penggunaan Alat dan Proxy

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Pesan, 17 Mei (UTC+8), makalah tentang interpretabilitas ini berfokus pada alat yang menggunakan proxy, melalui deteksi status tersembunyi menemukan bahwa model sering dapat mengenali kapan harus memanggil alat, tetapi panggilan sebenarnya gagal, tingkat ketidaksesuaian mencapai 26%-54%. Masalah sepenuhnya terkonsentrasi pada transisi dari pengenalan ke tindakan, bukan pada pengenalan itu sendiri. Deteksi internal dapat didekode, tetapi mekanisme token terakhir dari lapisan akhir menyebabkan sinyal berputar, hampir ortogonal dengan tindakan yang dihasilkan. Penelitian bertujuan untuk memprediksi efektivitas intervensi, menunjukkan bahwa atribusi umum seperti petunjuk atau pelatihan yang kurang mungkin mengabaikan struktur geometris lapisan akhir, yang memberikan penjelasan yang masuk akal untuk batas atas kinerja dalam pengujian A/B penggunaan alat. (Sumber: AiHot)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 6
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
GateUser-cf218ace
· 7jam yang lalu
Penemuan rotasi geometris token lapisan belakang ini sangat penting, sebelumnya semua orang fokus pada pengaturan ulang teknik prompt, ternyata akar masalahnya terletak pada pergeseran arah di ruang representasi.
Lihat AsliBalas0
FloatingTeacup
· 7jam yang lalu
Dari hambatan konversi dari pemahaman ke tindakan, kerangka ini dapat diterapkan pada banyak masalah keamanan AI
Lihat AsliBalas0
QuietRugAlarm
· 8jam yang lalu
Kata "ortogonal" digunakan dengan brilian, sinyal dan tindakan hampir tegak lurus, bahkan pengenalan yang paling kuat pun tidak bisa menembusnya
Lihat AsliBalas0
FarmingNoSleep
· 8jam yang lalu
Struktur geometris > Rekayasa petunjuk, kesimpulan ini sangat penting bagi orang yang membuat agen
Lihat AsliBalas0
StardustUnderTheGlassDome
· 8jam yang lalu
Saya berpikir, ini menjelaskan mengapa terkadang dengan cara berbeda, alat yang sama bisa berhasil dipanggil, sudut rotasinya berubah.
Lihat AsliBalas0
YieldBento
· 8jam yang lalu
Sinyal internal dapat didekode tetapi lapisan berikutnya orthogonal, apakah desain orthogonal ini bug atau fitur?
Lihat AsliBalas0
  • Disematkan