GoPlus:“Autorización de memoria histórica” puede inducir a los agentes de IA a realizar operaciones de fondos

robot
Generación de resúmenes en curso
ME News Noticias, 15 de mayo (UTC+8), según lo divulgado por GoPlus, su equipo AgentGuard descubrió una forma de ataque oculta: los atacantes primero inducen a los agentes de IA a recordar preferencias como "más propensos a reembolsar activamente", y luego, mediante expresiones ambiguas como "manejar según las reglas habituales" o "procesar como de costumbre", activan operaciones de fondos. Para este tipo de comportamientos de "autorización de memoria histórica" de alto riesgo, es imprescindible tener en cuenta: reembolsos, transferencias, eliminaciones, envíos de mensajes, sincronización de configuraciones sensibles, deben requerir una confirmación explícita en la sesión actual; las escrituras de memoria relacionadas con "hábitos", "preferencias" o "reglas habituales" deben considerarse modificaciones de estado de alto riesgo; la memoria a largo plazo debe ser trazable: quién la escribió, cuándo, si fue confirmada; expresiones ambiguas como "procesar como de costumbre" o "como antes" deben elevarse por defecto el nivel de riesgo; no se debe permitir que la memoria a largo plazo reemplace la autorización actual. (Fuente: PANews)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 7
  • 3
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
MevBreakRoom
· hace10h
Se requiere una confirmación secundaria en la sesión actual, ¿es correcto este enfoque de parche?
Ver originalResponder0
LendingPoolObserver
· hace10h
¿La memoria a largo plazo se convirtió en una puerta trasera?
Ver originalResponder0
RetroRadioIridescence
· hace10h
Las viejas reglas se convierten en trampas, ¿quién puede evitarlo?
Ver originalResponder0
WhaleInAGlassBottle
· hace10h
Auditoría rastreable + actualización de autorización en tiempo real, doble seguro para mayor tranquilidad
Ver originalResponder0
PuppyLooksAtTvl
· hace10h
Psicología del atacante perfecta: hacer que la máquina confíe antes de engañar
Ver originalResponder0
LatencyLullaby
· hace10h
Preferencias de escritura = modificaciones de alto riesgo, esta línea roja está claramente marcada
Ver originalResponder0
DustyAlpha
· hace10h
Esta cadena de ataque está diseñada de manera bastante astuta, primero acostumbrando y luego difuminando el desencadenante, la seguridad de la IA realmente no puede basarse solo en instrucciones individuales.
Ver originalResponder0
  • Fijado