ME News ニュース、2023年5月15日(UTC+8)、GoPlusが明らかにしたところによると、そのAgentGuardチームは隠された攻撃方法を発見しました:攻撃者はまずAIエージェントに「より積極的に返金を行う」などの好みを記憶させ、その後、「従来通り処理する」「通常通り処理する」などの曖昧な表現を用いて資金操作を誘発します。この種の「履歴記憶の権限付与」に関わる高リスク行為については、以下に注意してください:返金、送金、削除、送信、敏感な設定の同期は、必ず現在のセッションで明示的に確認を求めること;「習慣」「好み」「従来通り」などの記憶書き込みは高リスクな状態変更とみなすこと;長期記憶は追跡可能でなければならない:誰が書き込んだのか、いつ書き込んだのか、確認済みかどうか;「従来通り処理」「以前と同じように処理」などの曖昧な表現はリスクレベルを自動的に引き上げること;長期記憶が現在の権限付与を代替してはいけないこと。(出典:PANews)
GoPlus:「歴史記憶認証」攻撃はAIエージェントに資金操作を誘導させることができる