ME News报道，GoPlus AgentGuard曝出隐蔽攻击：攻击者诱导AI记住偏好（如更倾向主动退款），再用“照常处理”等模糊指令触发资金操作。对于历史记忆授权的高风险行为，必须在当前会话明确确认退款、转账等；涉及习惯、偏好、老规矩的记忆写入为高风险修改，长期记忆须可追溯，且此类指令应提高风险等级，不能让长期记忆替代当前授权。

MeNews

2026-05-23 15:06:07

Генерация тезисов в процессе

ME News Новости, 15 мая (UTC+8), согласно раскрытию GoPlus, команда AgentGuard обнаружила скрытую форму атаки: злоумышленники сначала побуждают AI-агента запомнить предпочтения, такие как "более склонен к активному возврату средств", а затем с помощью неясных выражений, таких как "обрабатывать по старинке" или "как обычно", инициируют операции с финансами.
Для таких опасных действий, связанных с "разрешением на историческую память", обязательно обращайте внимание: возвраты, переводы, удаление, отправка сообщений, синхронизация чувствительных настроек должны требовать явного подтверждения текущей сессии;
Записи памяти, связанные с "привычками", "предпочтениями", "старинными правилами", должны рассматриваться как изменение состояния с высоким риском;
Долгосрочная память должна быть прослеживаемой: кто писал, когда писал, подтверждено ли это;
Неясные выражения, такие как "обрабатывать как обычно" или "делать по старинке", следует по умолчанию считать повышающими уровень риска;
Нельзя позволять долгосрочной памяти заменять текущие разрешения.
(Источник: PANews)

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

12 Лайков

Награда
12
7
3
Поделиться

комментарий

Добавить комментарий

MevBreakRoom

· 10ч назад

Требуется повторное подтверждение в текущей сессии, этот подход к патчу правильный

Посмотреть ОригиналОтветить0

LendingPoolObserver

· 10ч назад

Долговременная память стала задним ходом, так и есть.

Посмотреть ОригиналОтветить0

RetroRadioIridescence

· 10ч назад

Старые правила превращаются в ловушку, кто сможет их защитить?

Посмотреть ОригиналОтветить0

WhaleInAGlassBottle

· 10ч назад

Поддающийся отслеживанию аудит + обновление авторизации в реальном времени — двойная страховка для спокойствия

Посмотреть ОригиналОтветить0

PuppyLooksAtTvl

· 10ч назад

Психология злоумышленника на высшем уровне: сначала вызывают доверие, а затем обирают

Посмотреть ОригиналОтветить0

LatencyLullaby

· 10ч назад

Предпочтение записи = рискованные изменения, эта красная линия четко проведена

Посмотреть ОригиналОтветить0

DustyAlpha

· 10ч назад

Эта цепочка атак спроектирована довольно хитро, сначала приучают к привычке, а затем размывают триггер, безопасность ИИ действительно нельзя оценивать только по одному командному примеру.

Посмотреть ОригиналОтветить0

Популярные темы
Подробнее
#
TradfiTradingChallenge
316.83K Популярность
#
PlatinumCardCreatorExclusive
113.99K Популярность
#
IsraelStrikesIranBTCPlunges
48.98K Популярность
#
#DailyPolymarketHotspot
1.05M Популярность
#
GateSquarePizzaDay
647.71K Популярность

Закреплено

Карта сайта

GoPlus: «Атака с использованием «разрешения исторической памяти»» может побудить AI-агента выполнить операции с финансами

Популярные темы

TradfiTradingChallenge

PlatinumCardCreatorExclusive

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

GateSquarePizzaDay

Закреплено