AgentFlowが300のエージェントを合成し、サンドボックスエスケープを含むChromeのゼロデイ脆弱性10件を発見

ME News 消息,4 月 23 日(UTC+8),据 动察 Beating 监测,UCSB Yu Feng 团队联合 fuzz.land 等机构提出 AgentFlow,自动合成多 agent harness(编排 agent 角色分工、信息传递、工具分配和重试逻辑的程序)用于漏洞发现。论文指出模型不变时仅改 harness 就能让成功率差数倍,但现有方案多为手工编写或只搜索局部设计空间。 AgentFlow 用带类型的图 DSL 将 harness 五个维度(角色、拓扑、消息模式、工具绑定、协调协议)统一为可编辑图程序,单步可同时增改 agent、拓扑、prompt 和工具集。外循环从目标程序的覆盖率、sanitizer 报告等运行时信号中定位失败环节,取代通过/失败的二元反馈。TerminalBench-2 上搭配 Claude Opus 4.6 达到 84.3%(75/89),为该排行榜同类最高分。 Chrome 代码库(3500 万行 C/C++)上,系统合成 300 余个 agent 组成的 harness,自动演化出的 agent 指令专攻 C++ 内存安全漏洞,要求用 ASAN/UBSAN 验证崩溃,多 agent 通过共享文档和文件锁去重。用开源模型 Kimi K2.5 在 192 块 H100 上运行 7 天,发现 10 个零日漏洞,全部经 Chrome VRP 确认。6 个已获 CVE 编号,涉及 WebCodecs、Proxy、Network、Codecs、Rendering,类型含 UAF、整数溢出和堆缓冲区溢出,其中 CVE-2026-5280 和 CVE-2026-6297 为 Critical 级别沙箱逃逸。 fuzz.land 联合创始人寿超璠称部分漏洞最初用 MiniMax M2.5 发现,MiniMax M2.5 和 Opus 4.6 也能发现大部分。AgentFlow 已开源。 (来源:BlockBeats)ME News 消息、4 月 23 日(UTC+8)、動察 Beating の監視によると、UCSB Yu Feng チームは fuzz.land などの機関と協力して AgentFlow を提案した。これは、脆弱性発見のためにマルチエージェントハーネス(エージェントの役割分担、情報伝達、ツール割り当て、リトライロジックを編成するプログラム)を自動合成するものである。論文では、モデルを変更せずにハーネスのみを変更しただけで成功率が数倍異なることを指摘しているが、既存の手法はほとんどが手動で記述されるか、局所的な設計空間のみを探索するものである。AgentFlow は型付きグラフ DSL を使用して、ハーネスの5つの次元(役割、トポロジ、メッセージパターン、ツールバインディング、調整プロトコル)を編集可能なグラフプログラムに統一し、1ステップでエージェント、トポロジ、プロンプト、ツールセットを同時に追加・変更できる。外側のループは、対象プログラムのカバレッジやサニタイザレポートなどの実行時シグナルから失敗箇所を特定し、合格/不合格の二値フィードバックを置き換える。TerminalBench-2 では、Claude Opus 4.6 と組み合わせて 84.3%(75/89)を達成し、このランキングの同種最高得点である。Chrome コードベース(3500万行の C/C++)では、システムが 300 以上のエージェントからなるハーネスを合成し、自動進化したエージェント命令が C++ のメモリ安全性脆弱性を専門に狙い、ASAN/UBSAN を使用したクラッシュ検証を要求し、複数のエージェントが共有ドキュメントとファイルロックによって重複を排除する。オープンソースモデル Kimi K2.5 を 192 台の H100 上で 7 日間実行し、10 個のゼロデイ脆弱性を発見し、すべて Chrome VRP によって確認された。6 つはすでに CVE 番号を取得しており、WebCodecs、Proxy、Network、Codecs、Rendering に関連し、タイプは UAF、整数オーバーフロー、ヒープバッファオーバーフローを含み、そのうち CVE-2026-5280 と CVE-2026-6297 は Critical レベルのサンドボックスエスケープである。fuzz.land の共同設立者である寿超璠氏は、一部の脆弱性は当初 MiniMax M2.5 によって発見され、MiniMax M2.5 と Opus 4.6 でも大部分を発見できると述べている。AgentFlow は既にオープンソース化されている。(出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし