GoPlus: “Autorização de memória histórica” ataque pode induzir o agente de IA a executar operações financeiras

robot
Geração do resumo em andamento
ME News Notícias, 15 de maio (UTC+8), de acordo com a GoPlus, sua equipe AgentGuard descobriu uma forma de ataque oculta: o atacante primeiro induz o agente de IA a lembrar de preferências como "mais propenso a reembolsar ativamente", e depois, por meio de expressões ambíguas como "tratar como de costume" e "lidar normalmente", aciona operações de fundos. Para esse tipo de comportamento de alto risco de "autorização de memória histórica", é imprescindível atenção: reembolsos, transferências, exclusões, envios de mensagens, sincronização de configurações sensíveis, devem exigir confirmação explícita na sessão atual; a escrita de memórias envolvendo "hábito", "preferência" e "regra antiga" deve ser considerada uma modificação de estado de alto risco; memórias de longo prazo devem ser rastreáveis: quem escreveu, quando escreveu, se foi confirmada; expressões ambíguas como "lidar como de costume" e "seguir como antes" devem, por padrão, elevar o nível de risco; não permitir que memórias de longo prazo substituam a autorização atual. (Fonte: PANews)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 7
  • 3
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
MevBreakRoom
· 2h atrás
É necessário uma segunda confirmação na sessão atual, essa abordagem de patch está correta
Ver originalResponder0
LendingPoolObserver
· 2h atrás
A memória de longo prazo se tornou uma porta dos fundos, de fato.
Ver originalResponder0
RetroRadioIridescence
· 2h atrás
A velha rotina virou armadilha, quem pode se proteger disso?
Ver originalResponder0
WhaleInAGlassBottle
· 2h atrás
Auditoria rastreável + atualização de autorização em tempo real, dupla proteção para maior segurança
Ver originalResponder0
PuppyLooksAtTvl
· 2h atrás
Psicologia do atacante em pontuação máxima: fazer a máquina confiar antes de colher
Ver originalResponder0
LatencyLullaby
· 2h atrás
Preferência de gravação = modificação de alto risco, essa linha vermelha está claramente definida
Ver originalResponder0
DustyAlpha
· 2h atrás
Essa cadeia de ataque foi projetada de forma bastante insidiosa, primeiro criando o hábito e depois acionando de forma difusa, a segurança de IA realmente não pode se basear apenas em comandos isolados.
Ver originalResponder0
  • Fixado