AgentFlow sintetizou 300 Agentes e descobriu 10 vulnerabilidades de dia zero do Chrome, incluindo escape de sandbox.

ME News notícias, 23 de abril (UTC+8), segundo monitoramento do 动察 Beating, a equipe UCSB Yu Feng, em colaboração com fuzz.land e outras instituições, propôs o AgentFlow, que sintetiza automaticamente multi-agent harness (programas que orquestram a divisão de papéis dos agentes, transmissão de informações, alocação de ferramentas e lógica de repetição) para descoberta de vulnerabilidades.
O artigo aponta que, mantendo o modelo inalterado, apenas alterar o harness pode fazer a taxa de sucesso variar várias vezes, mas as soluções existentes são, em sua maioria, escritas manualmente ou buscam apenas um espaço de design local.
O AgentFlow utiliza um DSL de grafo tipado para unificar as cinco dimensões do harness (papéis, topologia, padrões de mensagem, vínculo de ferramentas, protocolo de coordenação) em um programa de grafo editável, permitindo adicionar ou modificar agentes, topologia, prompts e conjunto de ferramentas em um único passo.
O loop externo localiza as etapas de falha a partir de sinais de tempo de execução, como cobertura do programa alvo e relatórios de sanitizadores, substituindo o feedback binário de aprovação/reprovação.
No TerminalBench-2, combinado com Claude Opus 4.6, atingiu 84,3% (75/89), a maior pontuação entre os similares neste ranking.
No código-fonte do Chrome (35 milhões de linhas de C/C++), o sistema sintetizou um harness composto por mais de 300 agentes, com instruções de agentes evoluídas automaticamente focadas em vulnerabilidades de segurança de memória em C++, exigindo que as falhas fossem verificadas com ASAN/UBSAN, e múltiplos agentes deduplicando por meio de documentos compartilhados e bloqueios de arquivo.
Usando o modelo de código aberto Kimi K2.5 em 192 GPUs H100 por 7 dias, foram descobertas 10 vulnerabilidades zero-day, todas confirmadas pelo Chrome VRP.
Seis delas já receberam números CVE, envolvendo WebCodecs, Proxy, Network, Codecs, Rendering, com tipos incluindo UAF, estouro de inteiro e estouro de heap buffer, sendo que CVE-2026-5280 e CVE-2026-6297 são escapes de sandbox de nível Crítico.
O cofundador do fuzz.land, 寿超璠, afirmou que algumas vulnerabilidades foram inicialmente descobertas com MiniMax M2.5, e que MiniMax M2.5 e Opus 4.6 também conseguem detectar a maioria delas.
O AgentFlow já foi disponibilizado como código aberto.
(Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários