AgentFlow sintetizó 300 agentes para extraer 10 vulnerabilidades de día cero en Chrome, incluyendo escape de sandbox.

ME News mensaje, 23 de abril (UTC+8), según el monitoreo de Beating, el equipo de UCSB Yu Feng, en colaboración con fuzz.land y otras instituciones, propuso AgentFlow, que sintetiza automáticamente múltiples agentes harness (programas que orquestan la asignación de roles, transmisión de información, asignación de herramientas y lógica de reintento de los agentes) para la detección de vulnerabilidades. El artículo señala que, con el mismo modelo, simplemente cambiar el harness puede hacer que la tasa de éxito varíe varias veces, pero las soluciones actuales suelen ser escritas a mano o solo exploran un espacio de diseño local. AgentFlow utiliza un DSL de grafos con tipos para unificar las cinco dimensiones del harness (roles, topología, patrón de mensajes, vinculación de herramientas, protocolo de coordinación) en un programa de grafo editable, permitiendo agregar o modificar agentes, topología, prompts y conjuntos de herramientas en un solo paso. El bucle externo localiza los pasos fallidos a partir de señales en tiempo de ejecución como la cobertura del programa objetivo y los informes de sanitizers, reemplazando la retroalimentación binaria de aprobado/fallido. En TerminalBench-2, combinado con Claude Opus 4.6, alcanza un 84.3% (75/89), la puntuación más alta de su tipo en este ranking. En el código base de Chrome (35 millones de líneas de C/C++), el sistema sintetiza un harness compuesto por más de 300 agentes. Las instrucciones de los agentes evolucionadas automáticamente se especializan en vulnerabilidades de seguridad de memoria en C++, requiriendo verificación de fallos con ASAN/UBSAN, y múltiples agentes deduplican mediante documentos compartidos y bloqueos de archivos. Usando el modelo de código abierto Kimi K2.5 en 192 GPUs H100 durante 7 días, se descubrieron 10 vulnerabilidades de día cero, todas confirmadas por Chrome VRP. 6 ya tienen asignación CVE, involucrando WebCodecs, Proxy, Network, Codecs, Rendering, con tipos que incluyen UAF, desbordamiento de enteros y desbordamiento de búfer de heap. Entre ellas, CVE-2026-5280 y CVE-2026-6297 son de nivel crítico, escapes de sandbox. El cofundador de fuzz.land, Shou Chaofan, afirmó que algunas vulnerabilidades se descubrieron inicialmente con MiniMax M2.5, y que MiniMax M2.5 y Opus 4.6 también pueden detectar la mayoría. AgentFlow ya es de código abierto. (Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios