AgentFlow sintetizou 300 Agentes e descobriu 10 vulnerabilidades de dia zero no Chrome, incluindo escape de sandbox.

ME News消息,4月23日(UTC+8),据动察Beating监测,UCSB Yu Feng团队联合fuzz.land等机构提出AgentFlow,自动合成多agent harness(编排agent角色分工、信息传递、工具分配和重试逻辑的程序)用于漏洞发现。论文指出模型不变时仅改harness就能让成功率差数倍,但现有方案多为手工编写或只搜索局部设计空间。 AgentFlow用带类型的图DSL将harness五个维度(角色、拓扑、消息模式、工具绑定、协调协议)统一为可编辑图程序,单步可同时增改agent、拓扑、prompt和工具集。外循环从目标程序的覆盖率、sanitizer报告等运行时信号中定位失败环节,取代通过/失败的二元反馈。TerminalBench-2上搭配Claude Opus 4.6达到84.3%(75/89),为该排行榜同类最高分。 Chrome代码库(3500万行C/C++)上,系统合成300余个agent组成的harness,自动演化出的agent指令专攻C++内存安全漏洞,要求用ASAN/UBSAN验证崩溃,多agent通过共享文档和文件锁去重。用开源模型Kimi K2.5在192块H100上运行7天,发现10个零日漏洞,全部经Chrome VRP确认。6个已获CVE编号,涉及WebCodecs、Proxy、Network、Codecs、Rendering,类型含UAF、整数溢出和堆缓冲区溢出,其中CVE-2026-5280和CVE-2026-6297为Critical级别沙箱逃逸。 fuzz.land联合创始人寿超璠称部分漏洞最初用MiniMax M2.5发现,MiniMax M2.5和Opus 4.6也能发现大部分。AgentFlow已开源。 (来源:BlockBeats)ME News消息,4月23日(UTC+8),据动察Beating监测,UCSB Yu Feng团队联合fuzz.land等机构提出AgentFlow,自动合成多agent harness(编排agent角色分工、信息传递、工具分配和重试逻辑的程序)用于漏洞发现。论文指出模型不变时仅改harness就能让成功率差数倍,但现有方案多为手工编写或只搜索局部设计空间。 AgentFlow用带类型的图DSL将harness五个维度(角色、拓扑、消息模式、工具绑定、协调协议)统一为可编辑图程序,单步可同时增改agent、拓扑、prompt和工具集。外循环从目标程序的覆盖率、sanitizer报告等运行时信号中定位失败环节,取代通过/失败的二元反馈。TerminalBench-2上搭配Claude Opus 4.6达到84.3%(75/89),为该排行榜同类最高分。 Chrome代码库(3500万行C/C++)上,系统合成300余个agent组成的harness,自动演化出的agent指令专攻C++内存安全漏洞,要求用ASAN/UBSAN验证崩溃,多agent通过共享文档和文件锁去重。用开源模型Kimi K2.5在192块H100上运行7天,发现10个零日漏洞,全部经Chrome VRP确认。6个已获CVE编号,涉及WebCodecs、Proxy、Network、Codecs、Rendering,类型含UAF、整数溢出和堆缓冲区溢出,其中CVE-2026-5280和CVE-2026-6297为Critical级别沙箱逃逸。 fuzz.land联合创始人寿超璠称部分漏洞最初用MiniMax M2.5发现,MiniMax M2.5和Opus 4.6也能发现大部分。AgentFlow已开源。 (来源:BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários