AgentFlow menggabungkan 300 Agen untuk menggali 10 kerentanan zero-day Chrome termasuk pelarian sandbox.

ME News消息,4月23日(UTC+8),menurut pemantauan Beating, tim UCSB Yu Feng bersama fuzz.land dan institusi lain mengusulkan AgentFlow, yang secara otomatis mensintesis multi-agent harness (program yang mengatur pembagian peran agen, transmisi informasi, alokasi alat, dan logika percobaan ulang) untuk penemuan kerentanan. Makalah menunjukkan bahwa dengan model yang sama, hanya dengan mengubah harness, tingkat keberhasilan bisa berbeda beberapa kali lipat, namun sebagian besar solusi yang ada ditulis secara manual atau hanya mencari ruang desain lokal. AgentFlow menggunakan DSL grafik bertipe untuk menyatukan lima dimensi harness (peran, topologi, pola pesan, pengikatan alat, protokol koordinasi) menjadi program grafik yang dapat diedit, dalam satu langkah dapat menambah atau mengubah agen, topologi, prompt, dan kumpulan alat secara bersamaan. Loop eksternal mengidentifikasi titik kegagalan dari sinyal runtime seperti cakupan program target dan laporan sanitizer, menggantikan umpan balik biner lulus/gagal. Di TerminalBench-2, dengan Claude Opus 4.6 mencapai 84,3% (75/89), skor tertinggi di papan peringkat yang sama. Pada basis kode Chrome (35 juta baris C/C++), sistem mensintesis harness yang terdiri dari lebih dari 300 agen, instruksi agen yang berevolusi secara otomatis berfokus pada kerentanan memori C++, memerlukan verifikasi crash menggunakan ASAN/UBSAN, multi-agen melakukan deduplikasi melalui dokumen bersama dan file kunci. Dengan model open source Kimi K2.5 yang berjalan di 192 unit H100 selama 7 hari, ditemukan 10 kerentanan zero-day, semuanya dikonfirmasi oleh Chrome VRP. 6 di antaranya telah mendapat nomor CVE, melibatkan WebCodecs, Proxy, Network, Codecs, Rendering, dengan tipe termasuk UAF, integer overflow, dan heap buffer overflow, di mana CVE-2026-5280 dan CVE-2026-6297 adalah sandbox escape level Critical. Salah satu pendiri fuzz.land, Shou Chaofan, mengatakan beberapa kerentanan awalnya ditemukan menggunakan MiniMax M2.5, dan MiniMax M2.5 serta Opus 4.6 juga dapat menemukan sebagian besar kerentanan. AgentFlow telah dirilis sebagai open source. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar