ME News报道，GoPlus AgentGuard曝出隐蔽攻击：攻击者诱导AI记住偏好（如更倾向主动退款），再用“照常处理”等模糊指令触发资金操作。对于历史记忆授权的高风险行为，必须在当前会话明确确认退款、转账等；涉及习惯、偏好、老规矩的记忆写入为高风险修改，长期记忆须可追溯，且此类指令应提高风险等级，不能让长期记忆替代当前授权。

MeNews

2026-05-23 15:06:07

Geração do resumo em andamento

ME News Notícias, 15 de maio (UTC+8), de acordo com a GoPlus, sua equipe AgentGuard descobriu uma forma de ataque oculta: o atacante primeiro induz o agente de IA a lembrar de preferências como "mais propenso a reembolsar ativamente", e depois, por meio de expressões ambíguas como "tratar como de costume" e "lidar normalmente", aciona operações de fundos. Para esse tipo de comportamento de alto risco de "autorização de memória histórica", é imprescindível atenção: reembolsos, transferências, exclusões, envios de mensagens, sincronização de configurações sensíveis, devem exigir confirmação explícita na sessão atual; a escrita de memórias envolvendo "hábito", "preferência" e "regra antiga" deve ser considerada uma modificação de estado de alto risco; memórias de longo prazo devem ser rastreáveis: quem escreveu, quando escreveu, se foi confirmada; expressões ambíguas como "lidar como de costume" e "seguir como antes" devem, por padrão, elevar o nível de risco; não permitir que memórias de longo prazo substituam a autorização atual. (Fonte: PANews)

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

9 Curtidas

Recompensa
9
7
3
Compartilhar

Comentário

Adicionar um comentário

MevBreakRoom

· 2h atrás

É necessário uma segunda confirmação na sessão atual, essa abordagem de patch está correta

Ver originalResponder0

LendingPoolObserver

· 2h atrás

A memória de longo prazo se tornou uma porta dos fundos, de fato.

Ver originalResponder0

RetroRadioIridescence

· 2h atrás

A velha rotina virou armadilha, quem pode se proteger disso?

Ver originalResponder0

WhaleInAGlassBottle

· 2h atrás

Auditoria rastreável + atualização de autorização em tempo real, dupla proteção para maior segurança

Ver originalResponder0

PuppyLooksAtTvl

· 2h atrás

Psicologia do atacante em pontuação máxima: fazer a máquina confiar antes de colher

Ver originalResponder0

LatencyLullaby

· 2h atrás

Preferência de gravação = modificação de alto risco, essa linha vermelha está claramente definida

Ver originalResponder0

DustyAlpha

· 2h atrás

Essa cadeia de ataque foi projetada de forma bastante insidiosa, primeiro criando o hábito e depois acionando de forma difusa, a segurança de IA realmente não pode se basear apenas em comandos isolados.

Ver originalResponder0

Tendências
Ver projetos
#
TradfiTradingChallenge
308.02K Popularidade
#
PlatinumCardCreatorExclusive
94.18K Popularidade
#
IsraelStrikesIranBTCPlunges
48.83K Popularidade
#
#DailyPolymarketHotspot
1.04M Popularidade
#
GateSquarePizzaDay
1.77M Popularidade

Fixado

sitemap

GoPlus: “Autorização de memória histórica” ataque pode induzir o agente de IA a executar operações financeiras

Tendências

TradfiTradingChallenge

PlatinumCardCreatorExclusive

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

GateSquarePizzaDay

Fixado