GoPlus:“Otorisasi Memori Sejarah” serangan dapat memancing agen AI untuk melakukan operasi dana

robot
Pembuatan abstrak sedang berlangsung
ME News Berita, 15 Mei (UTC+8), menurut GoPlus mengungkapkan bahwa tim AgentGuard mereka menemukan sebuah metode serangan tersembunyi: penyerang terlebih dahulu memancing agen AI untuk mengingat preferensi seperti "lebih cenderung untuk mengembalikan dana secara aktif", kemudian melalui ungkapan ambigu seperti "menangani sesuai kebiasaan" "menangani seperti biasa" memicu operasi dana. Untuk perilaku berisiko tinggi seperti "otorisasi memori sejarah", wajib diperhatikan: pengembalian dana, transfer, penghapusan, pengiriman, sinkronisasi konfigurasi sensitif, harus meminta konfirmasi eksplisit dari sesi saat ini; penulisan memori yang melibatkan "kebiasaan" "preferensi" "kebiasaan lama" harus dipandang sebagai modifikasi status risiko tingkat tinggi; memori jangka panjang harus dapat dilacak: siapa yang menulis, kapan menulis, apakah sudah dikonfirmasi; ungkapan ambigu seperti "menangani sesuai kebiasaan" "melakukan seperti sebelumnya" harus secara default meningkatkan tingkat risiko; jangan biarkan memori jangka panjang menggantikan otorisasi saat ini. (Sumber: PANews)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 7
  • 3
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
MevBreakRoom
· 10jam yang lalu
Harus dikonfirmasi ulang dalam sesi saat ini, ide patch ini benar
Lihat AsliBalas0
LendingPoolObserver
· 10jam yang lalu
Memori jangka panjang menjadi pintu belakang, itu termasuk.
Lihat AsliBalas0
RetroRadioIridescence
· 10jam yang lalu
Aturan lama berubah menjadi perangkap, siapa yang bisa menghindarinya
Lihat AsliBalas0
WhaleInAGlassBottle
· 10jam yang lalu
Audit yang dapat dilacak + peningkatan otorisasi waktu nyata, perlindungan ganda agar tenang
Lihat AsliBalas0
PuppyLooksAtTvl
· 10jam yang lalu
Psikologi penyerang skor penuh: membangun kepercayaan manusia dan mesin lalu menuai hasilnya
Lihat AsliBalas0
LatencyLullaby
· 10jam yang lalu
Preferensi penulisan=modifikasi risiko tinggi, garis merah ini digambar dengan jelas
Lihat AsliBalas0
DustyAlpha
· 10jam yang lalu
Rantai serangan ini dirancang cukup licik, pertama membiasakan kebiasaan lalu memicu secara kabur, Keamanan AI memang tidak bisa hanya melihat instruksi tunggal
Lihat AsliBalas0
  • Disematkan