ME News Noticias, 23 de abril (UTC+8), según monitoreo de Beating, el equipo de UCSB Yu Feng, en colaboración con fuzz.land y otras instituciones, propuso AgentFlow, que sintetiza automáticamente múltiples harness de agentes (programas que orquestan la división de roles de agentes, transmisión de información, asignación de herramientas y lógica de reintento) para el descubrimiento de vulnerabilidades. El artículo señala que, con el modelo sin cambios, solo modificar el harness puede hacer que la tasa de éxito difiera varias veces, pero las soluciones existentes son en su mayoría escritas manualmente o solo exploran un espacio de diseño local. AgentFlow utiliza un DSL de grafo con tipos para unificar las cinco dimensiones del harness (roles, topología, patrón de mensajes, enlace de herramientas, protocolo de coordinación) en un programa de grafo editable, permitiendo agregar o modificar agentes, topología, prompts y conjunto de herramientas en un solo paso. El bucle externo localiza las etapas fallidas a partir de señales de tiempo de ejecución como la cobertura del programa objetivo e informes de sanitizadores, reemplazando la retroalimentación binaria de aprobado/fallo. En TerminalBench-2, combinado con Claude Opus 4.6, alcanzó un 84.3% (75/89), la puntuación más alta de su tipo en esa tabla de clasificación. En el código base de Chrome (35 millones de líneas de C/C++), el sistema sintetiza un harness compuesto por más de 300 agentes, y las instrucciones de los agentes evolucionadas automáticamente se especializan en vulnerabilidades de seguridad de memoria en C++, requiriendo verificación de fallos con ASAN/UBSAN. Los múltiples agentes desduplican mediante documentos compartidos y bloqueos de archivos. Usando el modelo de código abierto Kimi K2.5 en 192 H100 durante 7 días, se descubrieron 10 vulnerabilidades de día cero, todas confirmadas por Chrome VRP. 6 ya tienen asignación CVE, involucrando WebCodecs, Proxy, Network, Codecs, Rendering, con tipos que incluyen UAF, desbordamiento de enteros y desbordamiento de búfer en el heap, entre los cuales CVE-2026-5280 y CVE-2026-6297 son escapes de sandbox de nivel Crítico. El cofundador de fuzz.land, Shou Chaofan, afirmó que algunas vulnerabilidades fueron descubiertas inicialmente con MiniMax M2.5, y tanto MiniMax M2.5 como Opus 4.6 también pueden encontrar la mayoría. AgentFlow ya es de código abierto. (Fuente: BlockBeats)

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
SKHynixTopsKOSPIByMarketCap
1,56M Popularidad
#
MicronEarningsBeatExpectationsSharesRise
384,34K Popularidad
#
IsraelStrikesIranBTCPlunges
64,21K Popularidad
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
343,33K Popularidad
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
178,77K Popularidad

Fijado

AgentFlow sintetiza 300 Agentes para descubrir 10 vulnerabilidades de día cero de Chrome, incluyendo escape de sandbox.

Temas de actualidad

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Fijado