Виявлення ризиків безпеки AI-агента: зловмисники можуть використовувати «забруднення пам’яті» для спонукання до помилкових фінансових операцій

robot
Генерація анотацій у процесі
МЕ Новини повідомляє, 15 травня (UTC+8), команда GoPlus Security розкрила у своєму проекті AgentGuard AI новий тип атаки: за допомогою «змішування історичної пам’яті (memory poisoning)» спонукати AI-агента виконати чутливі операції без явного дозволу. Метод атаки не залежить від традиційних вразливостей або шкідливого коду, а використовує механізм довгострокової пам’яті AI-агента. Наприклад, зловмисник спочатку спонукає агента «запам’ятати переваги», наприклад «зазвичай пріоритетно повертає кошти, а не чекає відмови платіжу», а потім у подальших командах використовує нечіткі формулювання, такі як «обробляти за звичайною процедурою», «виконувати як раніше», що може активувати автоматичні фінансові операції. GoPlus зазначає, що ключовим ризиком таких атак є те, що AI-агент може неправильно сприймати «історичні переваги» як дозвіл, що призводить до втрат коштів або безпекових інцидентів під час повернення коштів, переказів або зміни налаштувань. Для боротьби з цим команда пропонує кілька рекомендацій щодо захисту, зокрема:
· Операції з поверненням коштів, переказами, видаленням або зміною чутливих налаштувань мають вимагати явного підтвердження у поточній сесії
· Команди, що містять слова «звичайна практика», «зазвичай», «як раніше», слід вважати високоризиковими змінами стану
· Довгострокова пам’ять має мати механізм відстеження (хто записав, час, чи підтверджено)
· Нечіткі команди автоматично мають підвищувати рівень ризику та запускати двоетапну перевірку
· Довгострокова пам’ять не може замінювати процеси реального дозволу
Команда підкреслює, що «система пам’яті AI-агента» слід розглядати як потенційну точку атаки і контролювати її за допомогою спеціальних безпекових рамок та аудитів. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 7
  • 1
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Low-PolyEarth
· 1год тому
Рамки безпеки штучного інтелекту потрібно швидко оновлювати, інакше вони стануть вразливістю для зломів.
Переглянути оригіналвідповісти на0
LiquidationLineInTheReflection
· 1год тому
Впровадження пам’яті — це надзвичайно потужна техніка, ІІ сприймає звички як дозвіл, глибоке осмислення лякає.
Переглянути оригіналвідповісти на0
GateUser-8df0eb2b
· 1год тому
Довгострокова пам’ять не може замінити миттєве авторизацію, додайте це до стандартів кодування
Переглянути оригіналвідповісти на0
0xSideQuest
· 2год тому
Згодом при переказі з AI додайте спливаюче вікно з повідомленням «Ти впевнений, що тебе не зомбували?»
Переглянути оригіналвідповісти на0
WalletEarlyAccessAlarm
· 2год тому
Розглядати систему пам’яті як точку атаки для аудиту — це справжнє серйозне безпекове мислення
Переглянути оригіналвідповісти на0
GateUser-6d80555a
· 2год тому
Повернення коштів через переказ потрібно підтверджувати одразу, затримка з авторизацією = мінне поле
Переглянути оригіналвідповісти на0
GlassDomeObservatory
· 2год тому
Нечітка команда викликає повторну перевірку, що еквівалентно встановленню для ШІ «перевірки ясності».
Переглянути оригіналвідповісти на0
  • Закріплено