GoPlus: «Атака с использованием «разрешения исторической памяти»» может побудить AI-агента выполнить операции с финансами

robot
Генерация тезисов в процессе
ME News Новости, 15 мая (UTC+8), согласно раскрытию GoPlus, команда AgentGuard обнаружила скрытую форму атаки: злоумышленники сначала побуждают AI-агента запомнить предпочтения, такие как "более склонен к активному возврату средств", а затем с помощью неясных выражений, таких как "обрабатывать по старинке" или "как обычно", инициируют операции с финансами.
Для таких опасных действий, связанных с "разрешением на историческую память", обязательно обращайте внимание: возвраты, переводы, удаление, отправка сообщений, синхронизация чувствительных настроек должны требовать явного подтверждения текущей сессии;
Записи памяти, связанные с "привычками", "предпочтениями", "старинными правилами", должны рассматриваться как изменение состояния с высоким риском;
Долгосрочная память должна быть прослеживаемой: кто писал, когда писал, подтверждено ли это;
Неясные выражения, такие как "обрабатывать как обычно" или "делать по старинке", следует по умолчанию считать повышающими уровень риска;
Нельзя позволять долгосрочной памяти заменять текущие разрешения.
(Источник: PANews)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 7
  • 3
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
MevBreakRoom
· 10ч назад
Требуется повторное подтверждение в текущей сессии, этот подход к патчу правильный
Посмотреть ОригиналОтветить0
LendingPoolObserver
· 10ч назад
Долговременная память стала задним ходом, так и есть.
Посмотреть ОригиналОтветить0
RetroRadioIridescence
· 10ч назад
Старые правила превращаются в ловушку, кто сможет их защитить?
Посмотреть ОригиналОтветить0
WhaleInAGlassBottle
· 10ч назад
Поддающийся отслеживанию аудит + обновление авторизации в реальном времени — двойная страховка для спокойствия
Посмотреть ОригиналОтветить0
PuppyLooksAtTvl
· 10ч назад
Психология злоумышленника на высшем уровне: сначала вызывают доверие, а затем обирают
Посмотреть ОригиналОтветить0
LatencyLullaby
· 10ч назад
Предпочтение записи = рискованные изменения, эта красная линия четко проведена
Посмотреть ОригиналОтветить0
DustyAlpha
· 10ч назад
Эта цепочка атак спроектирована довольно хитро, сначала приучают к привычке, а затем размывают триггер, безопасность ИИ действительно нельзя оценивать только по одному командному примеру.
Посмотреть ОригиналОтветить0
  • Закреплено