GoPlus:“Ủy quyền ghi nhớ lịch sử” tấn công có thể dẫn dụ AI đại lý thực hiện các thao tác tài chính

robot
Đang tạo bản tóm tắt
ME Tin tức, ngày 15 tháng 5 (UTC+8), theo tiết lộ của GoPlus, nhóm AgentGuard của họ phát hiện ra một phương thức tấn công tinh vi: kẻ tấn công trước tiên dụ AI đại lý ghi nhớ các sở thích như "ưu tiên hoàn tiền chủ động", sau đó thông qua các biểu đạt mơ hồ như "xử lý theo quy tắc cũ" "xử lý như thường lệ" để kích hoạt thao tác tài chính. Đối với các hành vi nguy hiểm cao như "ủy quyền ghi nhớ lịch sử", cần chú ý: hoàn tiền, chuyển khoản, xóa, gửi thư, đồng bộ cấu hình nhạy cảm, phải yêu cầu xác nhận rõ ràng trong phiên hiện tại; việc ghi nhớ liên quan đến "thói quen", "sở thích", "quy tắc cũ" phải được xem là thay đổi trạng thái rủi ro cao; ghi nhớ dài hạn phải có khả năng truy xuất nguồn gốc: ai đã ghi, khi nào ghi, có xác nhận hay không; các biểu đạt mơ hồ như "xử lý như thường lệ" "theo cách cũ" cần nâng cao mức độ rủi ro theo mặc định; không để ghi nhớ dài hạn thay thế quyền xác nhận hiện tại. (Nguồn: PANews)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 7
  • 3
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
MevBreakRoom
· 6giờ trước
Phải xác nhận lần nữa trong cuộc trò chuyện hiện tại, ý tưởng vá lỗi này đúng không
Xem bản gốcTrả lời0
LendingPoolObserver
· 6giờ trước
Dài hạn ghi nhớ trở thành cửa hậu đúng không?
Xem bản gốcTrả lời0
RetroRadioIridescence
· 6giờ trước
Thông lệ cũ biến thành cái bẫy, ai có thể phòng tránh được đây
Xem bản gốcTrả lời0
WhaleInAGlassBottle
· 6giờ trước
Kiểm toán có thể truy xuất nguồn gốc + Cấp phép nâng cấp theo thời gian thực, hai lớp bảo vệ mới yên tâm
Xem bản gốcTrả lời0
PuppyLooksAtTvl
· 6giờ trước
Tâm lý học của kẻ tấn công đạt điểm tối đa: xây dựng lòng tin của người và máy rồi mới thu hoạch
Xem bản gốcTrả lời0
LatencyLullaby
· 6giờ trước
Việc ghi đè sở thích = Thay đổi rủi ro cao, đường ranh giới này rõ ràng
Xem bản gốcTrả lời0
DustyAlpha
· 6giờ trước
Chuỗi tấn công này được thiết kế khá hiểm độc, trước tiên nuôi dưỡng thói quen rồi mới mờ nhạt kích hoạt, An toàn AI thực sự không thể chỉ dựa vào lệnh đơn lẻ
Xem bản gốcTrả lời0
  • Đã ghim