AgentFlow mensintesis 300 agen untuk menemukan 10 kerentanan zero-day Chrome termasuk pelarian sandbox.

ME News Berita, 23 April (UTC+8), menurut pemantauan Beating, tim UCSB Yu Feng bersama fuzz.land dan lembaga lainnya mengusulkan AgentFlow, yang secara otomatis mensintesis multi-agent harness (program yang mengatur pembagian peran agen, transmisi informasi, alokasi alat, dan logika percobaan ulang) untuk penemuan kerentanan. Makalah menunjukkan bahwa saat model tidak berubah, hanya mengubah harness dapat membuat perbedaan beberapa kali lipat dalam tingkat keberhasilan, tetapi solusi yang ada sebagian besar ditulis secara manual atau hanya mencari ruang desain lokal. AgentFlow menggunakan DSL grafik bertipe untuk menyatukan lima dimensi harness (peran, topologi, pola pesan, pengikatan alat, protokol koordinasi) menjadi program grafik yang dapat diedit, yang dalam satu langkah dapat secara bersamaan menambah/mengubah agen, topologi, prompt, dan kumpulan alat. Lingkaran luar menemukan titik kegagalan dari sinyal runtime seperti cakupan program target dan laporan sanitizer, menggantikan umpan balik biner lulus/gagal. Di TerminalBench-2 dengan Claude Opus 4.6 mencapai 84,3% (75/89), skor tertinggi di antara kategori serupa di papan peringkat tersebut. Pada basis kode Chrome (35 juta baris C/C++), sistem mensintesis harness yang terdiri dari lebih dari 300 agen, instruksi agen yang berevolusi secara otomatis berfokus pada kerentanan keamanan memori C++, memerlukan verifikasi crash dengan ASAN/UBSAN, multi-agen melakukan deduplikasi melalui dokumen bersama dan kunci file. Menggunakan model open-source Kimi K2.5 pada 192 unit H100 berjalan selama 7 hari, menemukan 10 kerentanan zero-day, semuanya dikonfirmasi oleh Chrome VRP. 6 di antaranya telah mendapatkan nomor CVE, melibatkan WebCodecs, Proxy, Network, Codecs, Rendering, dengan tipe termasuk UAF, integer overflow, dan heap buffer overflow, di mana CVE-2026-5280 dan CVE-2026-6297 adalah sandbox escape level Critical. Co-founder fuzz.land, Shou Chaofan, mengatakan beberapa kerentanan awalnya ditemukan menggunakan MiniMax M2.5, dan MiniMax M2.5 serta Opus 4.6 juga dapat menemukan sebagian besar. AgentFlow telah dijadikan open-source. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar