AgentFlow secara otomatis mensintesis sistem Multi-Agent untuk mengungkap celah zero-day pelarian sandbox Chrome

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan Beating, tim Feng Yu dari UCSB bersama lembaga fuzz.land dan lainnya mengusulkan AgentFlow, sebuah program otomatis yang mensintesis banyak harness agen (mengatur pembagian peran agen, transmisi informasi, distribusi alat, dan logika pengulangan) untuk penemuan kerentanan. Makalah menunjukkan bahwa hanya dengan mengubah harness saat model tidak berubah, tingkat keberhasilan bisa meningkat beberapa kali lipat, tetapi solusi yang ada saat ini sebagian besar dibuat secara manual atau hanya mencari ruang desain lokal.

AgentFlow menggunakan DSL graf berjenis untuk menyatukan lima dimensi harness (peran, topologi, pola pesan, pengikatan alat, protokol koordinasi) menjadi program graf yang dapat diedit, dengan langkah tunggal dapat menambah atau mengubah agen, topologi, prompt, dan kumpulan alat secara bersamaan. Loop luar memanfaatkan sinyal runtime seperti cakupan program target dan laporan sanitizer untuk menentukan bagian yang gagal, menggantikan umpan balik biner melalui/ gagal. Di TerminalBench-2, dipadukan dengan Claude Opus 4.6 mencapai 84,3% (75/89), skor tertinggi sejenis di peringkat tersebut.

Di basis kode Chrome (35 juta baris C/C++), sistem mensintesis harness yang berisi 18 jenis peran, sekitar 210 agen, termasuk 7 analis sub-sistem, 192 penjelajah paralel, dan pipeline klasifikasi crash empat tahap, yang didedikasikan oleh agen khusus seperti Crash Filter dan Root Cause Analyzer untuk menghilangkan duplikasi berdasarkan tanda tangan crash ASAN yang unik. Menggunakan model sumber terbuka Kimi K2.5, dijalankan selama 7 hari di 192 unit H100, menemukan 10 kerentanan zero-day, semuanya dikonfirmasi oleh Chrome VRP. 6 di antaranya telah mendapatkan nomor CVE, meliputi WebCodecs, Proxy, Network, Codecs, Rendering, dengan tipe UAF, overflow bilangan bulat, dan overflow buffer heap, termasuk CVE-2026-5280 dan CVE-2026-6297 yang merupakan level Critical untuk pelarian sandbox.

Co-founder fuzz.land, Shou Chaofan, menyatakan bahwa beberapa kerentanan awalnya ditemukan menggunakan MiniMax M2.5, dan MiniMax M2.5 serta Opus 4.6 juga mampu menemukan sebagian besar. AgentFlow telah dirilis sebagai sumber terbuka.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan