AgentFlowが300個のAgentを合成し、10個のChromeゼロデイ脆弱性(サンドボックスエスケープ含む)を発掘

ME News 消息,4 月 23 日(UTC+8),据 动察 Beating 监测,UCSB Yu Feng 团队联合 fuzz.land 等机构提出 AgentFlow,自动合成多 agent harness(编排 agent 角色分工、信息传递、工具分配和重试逻辑的程序)用于漏洞发现。論文指出モデル不変時にはハーネスのみを変更するだけで成功率が数倍異なるが、既存手法は手動記述または局所的な設計空間のみを探索するものが多い。AgentFlow は型付きグラフ DSL を用いてハーネスの5次元(役割、トポロジ、メッセージパターン、ツールバインディング、調整プロトコル)を編集可能なグラフプログラムに統一し、1ステップで agent、トポロジ、プロンプト、ツールセットの追加・変更を同時に行う。外側ループは対象プログラムのカバレッジ、サニタイザレポートなどの実行時信号から失敗箇所を特定し、成功/失敗の二値フィードバックに取って代わる。TerminalBench-2 上で Claude Opus 4.6 を用いて 84.3%(75/89)を達成し、同ランキングでの最高スコアとなる。Chrome コードベース(3500万行の C/C++)では、システムが 300 以上の agent からなるハーネスを合成し、自動進化した agent 命令は C++ メモリ安全脆弱性に特化し、ASAN/UBSAN によるクラッシュ検証を要求、複数 agent は共有ドキュメントとファイルロックにより重複排除を行う。オープンソースモデル Kimi K2.5 を 192 基の H100 上で 7 日間実行し、10 個のゼロデイ脆弱性を発見、すべて Chrome VRP により確認された。6 件は CVE 番号を取得し、WebCodecs、Proxy、Network、Codecs、Rendering に関連、タイプは UAF、整数オーバーフロー、ヒープバッファオーバーフローを含み、うち CVE-2026-5280 および CVE-2026-6297 は Critical レベルのサンドボックスエスケープである。fuzz.land 共同創業者の寿超璠氏によると、一部の脆弱性は当初 MiniMax M2.5 で発見されており、MiniMax M2.5 と Opus 4.6 でも大部分を発見可能である。AgentFlow はオープンソース化されている。(出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし