AgentFlow Secara Otomatis Mensintesis Sistem Multi-Agen untuk Mengungkap Kerentanan Zero-Day Pelarian Sandbox Chrome

Menurut pemantauan oleh Dongcha Beating, tim UCSB yang dipimpin oleh Feng Yu, bekerja sama dengan fuzz.land dan organisasi lain, telah mengusulkan AgentFlow, sintesis otomatis dari harness multi-agen (program yang mengorkestrasi peran agen, transfer informasi, alokasi alat, dan logika percobaan ulang) untuk penemuan kerentanan. Makalah menunjukkan bahwa ketika model tetap tidak berubah, hanya mengubah harness dapat secara signifikan meningkatkan tingkat keberhasilan, namun solusi yang ada sebagian besar ditulis secara manual atau hanya mencari ruang desain lokal. AgentFlow menggunakan DSL graf berjenis untuk menyatukan lima dimensi harness (peran, topologi, pola pesan, ikatan alat, dan protokol koordinasi) menjadi program graf yang dapat diedit, memungkinkan modifikasi simultan terhadap agen, topologi, prompt, dan set alat dalam satu langkah. Loop luar mengidentifikasi titik kegagalan dari sinyal runtime seperti cakupan program target dan laporan sanitizer, menggantikan umpan balik biner pass/fail. Pada TerminalBench-2, dikombinasikan dengan Claude Opus 4.6, mencapai tingkat keberhasilan 84,3% (75/89), skor tertinggi dalam kategorinya di leaderboard tersebut. Dalam basis kode Chrome (35 juta baris C/C++), sistem mensintesis harness yang berisi 18 peran dan sekitar 210 agen, termasuk 7 analis sub-sistem, 192 penjelajah paralel, dan pipeline klasifikasi crash empat tahap, di mana agen khusus seperti Crash Filter dan Root Cause Analyzer melakukan deduplikasi menggunakan tanda tangan crash ASAN yang unik. Menjalankan model sumber terbuka Kimi K2.5 pada 192 unit H100 selama 7 hari, sistem menemukan 10 kerentanan zero-day, semuanya dikonfirmasi oleh VRP Chrome. Enam di antaranya telah diberikan nomor CVE, melibatkan WebCodecs, Proxy, Network, Codec, dan Rendering, dengan tipe termasuk UAF, overflow integer, dan overflow buffer heap, di antaranya CVE-2026-5280 dan CVE-2026-6297 adalah escape sandbox tingkat kritis. Co-founder fuzz.land, Shou Chaofan, menyatakan bahwa beberapa kerentanan awalnya ditemukan menggunakan MiniMax M2.5, yang bersama Opus 4.6, juga dapat menemukan sebagian besar kerentanan. AgentFlow telah dirilis sebagai sumber terbuka.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan