AgentFlowが300個のAgentを合成し、サンドボックス脱出を含む10個のChromeゼロデイ脆弱性を発見

ME News の報道によると、4月23日(UTC+8)、動察 Beating の監視により、UCSBのYu Fengチームがfuzz.landなどの機関と共同でAgentFlowを提案しました。これは、マルチエージェントハーネス(エージェントの役割分担、情報伝達、ツール割り当て、再試行ロジックを編成するプログラム)を自動合成し、脆弱性発見に使用するものです。論文では、モデルが変わらない場合でもハーネスを変更するだけで成功率が数倍異なるが、既存の手法はほとんど手動で作成されているか、局所的な設計空間のみを探索していると指摘しています。AgentFlowは、型付きグラフDSLを使用して、ハーネスの5つの次元(役割、トポロジー、メッセージパターン、ツールバインディング、調整プロトコル)を編集可能なグラフプログラムに統一し、1ステップでエージェント、トポロジー、プロンプト、ツールセットを同時に追加・変更できます。外部ループは、対象プログラムのカバレッジやサニタイザーレポートなどの実行時シグナルから失敗箇所を特定し、合格/不合格の二値フィードバックを置き換えます。TerminalBench-2上でClaude Opus 4.6と組み合わせて84.3%(75/89)を達成し、このランキングの同カテゴリで最高スコアとなりました。Chromeコードベース(3500万行のC/C++)上で、システムは300以上のエージェントからなるハーネスを合成し、自動進化したエージェント命令はC++メモリ安全性の脆弱性に特化し、ASAN/UBSANを使用してクラッシュを検証し、複数のエージェントが共有ドキュメントとファイルロックにより重複排除を行います。オープンソースモデルKimi K2.5を使用し、192台のH100上で7日間実行し、10個のゼロデイ脆弱性を発見し、すべてChrome VRPによって確認されました。6つはすでにCVE番号を取得しており、WebCodecs、Proxy、Network、Codecs、Renderingに関連し、タイプはUAF、整数オーバーフロー、ヒープバッファオーバーフローを含み、そのうちCVE-2026-5280とCVE-2026-6297はCriticalレベルのサンドボックスエスケープです。fuzz.landの共同創業者である寿超璠氏は、一部の脆弱性は当初MiniMax M2.5で発見され、MiniMax M2.5とOpus 4.6でも大部分を発見できると述べています。AgentFlowはオープンソース化されています。(出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし