Notícias ME News, 23 de abril (UTC+8), de acordo com a monitorização do 动察 Beating, a equipa UCSB Yu Feng, em colaboração com a fuzz.land e outras instituições, propôs o AgentFlow, que sintetiza automaticamente um harness multi-agente (um programa que orquestra a divisão de papéis dos agentes, transmissão de informações, atribuição de ferramentas e lógica de repetição) para descoberta de vulnerabilidades. O artigo aponta que, mantendo o modelo inalterado, apenas alterar o harness pode fazer a taxa de sucesso diferir várias vezes, mas as soluções existentes são maioritariamente escritas manualmente ou apenas exploram espaços de design locais. O AgentFlow utiliza um DSL de grafo com tipos para unificar as cinco dimensões do harness (funções, topologia, padrões de mensagens, vinculação de ferramentas, protocolos de coordenação) num programa de grafo editável, permitindo que, num único passo, sejam adicionados ou modificados agentes, topologia, prompts e conjuntos de ferramentas. O ciclo externo localiza pontos de falha a partir de sinais de runtime, como cobertura do programa alvo e relatórios de sanitizers, substituindo o feedback binário de aprovação/reprovação. No TerminalBench-2, combinado com Claude Opus 4.6, alcançou 84.3% (75/89), a pontuação mais alta da sua categoria nesse ranking. Na base de código do Chrome (35 milhões de linhas de C/C++), o sistema sintetizou um harness composto por mais de 300 agentes, cujas instruções evoluídas automaticamente atacam especificamente vulnerabilidades de segurança de memória em C++, exigindo a verificação de crashes com ASAN/UBSAN, e múltiplos agentes deduplicam através de documentos partilhados e bloqueios de ficheiros. Usando o modelo open-source Kimi K2.5 em 192 GPUs H100 durante 7 dias, foram descobertas 10 vulnerabilidades zero-day, todas confirmadas pelo Chrome VRP. Seis já receberam números CVE, envolvendo WebCodecs, Proxy, Network, Codecs, Rendering, com tipos incluindo UAF, integer overflow e heap buffer overflow, das quais CVE-2026-5280 e CVE-2026-6297 são escapes de sandbox de nível Critical. O co-fundador da fuzz.land, Shou Chaofan, afirmou que algumas vulnerabilidades foram inicialmente descobertas com MiniMax M2.5, e que o MiniMax M2.5 e o Opus 4.6 também conseguem descobrir a maioria. O AgentFlow foi aberto (open source). (Fonte: 动察 Beating)

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
SKHynixTopsKOSPIByMarketCap
1,56M Popularidade
#
MicronEarningsBeatExpectationsSharesRise
384,34K Popularidade
#
IsraelStrikesIranBTCPlunges
64,12K Popularidade
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
345,01K Popularidade
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
178,77K Popularidade

Fixado

AgentFlow sintetiza 300 Agentes para descobrir 10 vulnerabilidades zero-day do Chrome, incluindo fuga de sandbox.

Tópicos em destaque

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Fixado