习惯偏好写入长期记忆是危险信号,AgentGuard得把历史记忆的触发阈值拉高,别让模糊指令钻空子

ME News
GoPlus:“历史记忆授权”攻击可诱导AI代理执行资金操作
ME News报道,GoPlus AgentGuard曝出隐蔽攻击:攻击者诱导AI记住偏好(如更倾向主动退款),再用“照常处理”等模糊指令触发资金操作。对于历史记忆授权的高风险行为,必须在当前会话明确确认退款、转账等;涉及习惯、偏好、老规矩的记忆写入为高风险修改,长期记忆须可追溯,且此类指令应提高风险等级,不能让长期记忆替代当前授权。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论