AgentFlow sintetizou 300 Agentes e descobriu 10 vulnerabilidades zero-day do Chrome, incluindo fuga de sandbox.

ME News informa que, em 23 de abril (UTC+8), segundo monitoramento do Beating, a equipe de Yu Feng da UCSB, em colaboração com fuzz.land e outras instituições, propôs o AgentFlow, que sintetiza automaticamente multi-agent harness (programas que organizam divisão de papéis, transmissão de informações, alocação de ferramentas e lógica de repetição entre agentes) para descoberta de vulnerabilidades. O artigo aponta que, com o modelo inalterado, apenas modificar o harness pode alterar a taxa de sucesso em várias vezes, mas as soluções atuais são em sua maioria escritas manualmente ou apenas exploram espaços de design locais. O AgentFlow utiliza um DSL gráfico tipado que unifica as cinco dimensões do harness (papéis, topologia, padrões de mensagens, vinculação de ferramentas, protocolos de coordenação) em um programa gráfico editável, permitindo adicionar ou modificar simultaneamente agentes, topologia, prompts e conjuntos de ferramentas em um único passo. O loop externo identifica pontos de falha a partir de sinais de tempo de execução, como cobertura do programa alvo e relatórios de sanitizers, substituindo o feedback binário de aprovação/reprovação. No TerminalBench-2, combinado com o Claude Opus 4.6, alcançou 84,3% (75/89), a pontuação mais alta entre soluções similares nesse ranking. No código-fonte do Chrome (35 milhões de linhas de C/C++), o sistema sintetizou um harness composto por mais de 300 agentes, com instruções de agentes evoluídas automaticamente focadas em vulnerabilidades de memória em C++, exigindo verificação de crashes com ASAN/UBSAN e desduplicação multi-agente através de documentos partilhados e bloqueios de ficheiros. Utilizando o modelo de código aberto Kimi K2.5 em 192 GPUs H100 durante 7 dias, foram descobertas 10 vulnerabilidades zero-day, todas confirmadas pelo Chrome VRP. Seis já receberam números CVE, envolvendo WebCodecs, Proxy, Network, Codecs e Rendering, com tipos incluindo UAF, integer overflow e heap buffer overflow, sendo que CVE-2026-5280 e CVE-2026-6297 são de nível Critical (sandbox escape). O cofundador da fuzz.land, Shou Chaofan, afirmou que algumas vulnerabilidades foram inicialmente descobertas com o MiniMax M2.5, sendo que o MiniMax M2.5 e o Opus 4.6 também conseguem detetar a maioria delas. O AgentFlow foi lançado como código aberto. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário