AgentFlow sintetiza 300 agentes y descubre 10 vulnerabilidades de día cero de Chrome, incluida la evasión del sandbox.

ME News mensaje, 23 de abril (UTC+8), según el monitoreo de Beating, el equipo de UCSB Yu Feng, en colaboración con fuzz.land y otras instituciones, propuso AgentFlow, que sintetiza automáticamente múltiples agentes harness (programas que organizan la división de roles de los agentes, la transmisión de información, la asignación de herramientas y la lógica de reintento) para la detección de vulnerabilidades. El documento señala que, sin cambiar el modelo, solo modificar el harness puede hacer que la tasa de éxito varíe varias veces, pero las soluciones existentes suelen escribirse manualmente o solo exploran un espacio de diseño local. AgentFlow utiliza un DSL de gráficos con tipos para unificar las cinco dimensiones del harness (roles, topología, patrón de mensajes, vinculación de herramientas, protocolo de coordinación) en un programa de gráficos editable, permitiendo agregar o modificar agentes, topología, prompts y conjuntos de herramientas en un solo paso. El bucle externo localiza los enlaces fallidos a partir de señales en tiempo de ejecución, como la cobertura del programa objetivo y los informes del sanitizer, reemplazando la retroalimentación binaria de éxito/fracaso. En TerminalBench-2, combinado con Claude Opus 4.6, alcanza un 84.3% (75/89), la puntuación más alta en la misma categoría de este ranking. En la base de código de Chrome (35 millones de líneas de C/C++), el sistema sintetiza un harness compuesto por más de 300 agentes, y las instrucciones de los agentes evolucionadas automáticamente se especializan en vulnerabilidades de seguridad de memoria en C++, requiriendo verificación de fallos con ASAN/UBSAN, y los múltiples agentes eliminan duplicados mediante documentos compartidos y bloqueos de archivos. Utilizando el modelo de código abierto Kimi K2.5 en 192 GPU H100 durante 7 días, se descubrieron 10 vulnerabilidades de día cero, todas confirmadas por Chrome VRP. Seis ya han recibido números CVE, que involucran WebCodecs, Proxy, Network, Codecs, Rendering, con tipos que incluyen UAF, desbordamiento de enteros y desbordamiento de búfer de montón, entre ellos CVE-2026-5280 y CVE-2026-6297 son fugas de la caja de arena de nivel Crítico. El cofundador de fuzz.land, Shou Chaofan, dijo que algunas vulnerabilidades fueron descubiertas inicialmente con MiniMax M2.5, y MiniMax M2.5 y Opus 4.6 también pueden detectar la mayoría. AgentFlow ya es de código abierto. (Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios