AgentFlow menggabungkan 300 agen untuk menemukan 10 kerentanan zero-day Chrome termasuk escape sandbox.

ME News berita, 23 April (UTC+8), menurut pemantauan 动察 Beating, tim UCSB Yu Feng bersama fuzz.land dan lembaga lainnya mengusulkan AgentFlow, yang secara otomatis mensintesis multi-agent harness (program yang mengatur pembagian peran agen, transmisi informasi, alokasi alat, dan logika pengulangan) untuk penemuan kerentanan. Makalah menunjukkan bahwa ketika model tidak berubah, hanya mengubah harness saja dapat membuat perbedaan beberapa kali lipat dalam tingkat keberhasilan, tetapi solusi yang ada sebagian besar ditulis manual atau hanya mencari ruang desain lokal. AgentFlow menggunakan DSL grafik bertipe untuk menyatukan lima dimensi harness (peran, topologi, pola pesan, pengikatan alat, protokol koordinasi) menjadi program grafik yang dapat diedit, yang dalam satu langkah dapat menambah/mengubah agen, topologi, prompt, dan kumpulan alat secara bersamaan. Loop eksternal mengidentifikasi titik kegagalan dari sinyal runtime seperti cakupan program target, laporan sanitizer, menggantikan umpan balik biner lulus/gagal. Pada TerminalBench-2 dengan Claude Opus 4.6 mencapai 84,3% (75/89), skor tertinggi untuk kategori serupa di peringkat tersebut. Pada basis kode Chrome (35 juta baris C/C++), sistem mensintesis harness yang terdiri dari lebih dari 300 agen, instruksi agen yang berevolusi secara otomatis menargetkan kerentanan keamanan memori C++, memerlukan verifikasi crash menggunakan ASAN/UBSAN, multi-agen melakukan deduplikasi melalui dokumen bersama dan file lock. Menggunakan model open-source Kimi K2.5 yang berjalan di 192 H100 selama 7 hari, menemukan 10 kerentanan zero-day, semuanya dikonfirmasi oleh Chrome VRP. 6 di antaranya telah mendapatkan nomor CVE, melibatkan WebCodecs, Proxy, Network, Codecs, Rendering, tipe meliputi UAF, integer overflow, dan heap buffer overflow, di mana CVE-2026-5280 dan CVE-2026-6297 adalah level Kritis escape sandbox. Pendiri bersama fuzz.land, Shou Chaofan, menyatakan bahwa sebagian kerentanan awalnya ditemukan menggunakan MiniMax M2.5, MiniMax M2.5 dan Opus 4.6 juga dapat menemukan sebagian besar. AgentFlow telah dirilis sebagai open-source. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar