Habituar preferências de escrita na memória de longo prazo é um sinal de perigo, o AgentGuard precisa aumentar o limiar de disparo da memória histórica para não deixar que comandos ambíguos explorem brechas.

Ver original
MeNews
GoPlus: “Ataque de autorização de memória histórica” pode induzir o agente de IA a executar operações financeiras
ME News reportou que o GoPlus AgentGuard revelou um ataque oculto: os atacantes induzem a IA a lembrar preferências (como uma maior propensão a reembolsar ativamente), e depois usam comandos ambíguos como "tratar normalmente" para acionar operações financeiras. Para ações de alta risco relacionadas à autorização de memórias históricas, é obrigatório confirmar explicitamente reembolsos, transferências, etc., na sessão atual; a escrita de memórias envolvendo hábitos, preferências e regras antigas é considerada uma modificação de alto risco, memórias de longo prazo devem ser rastreáveis, e esse tipo de comando deve aumentar o nível de risco, não permitindo que memórias de longo prazo substituam a autorização atual.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado