Beating监测显示，AgentFlow 自动合成多代理 harness，用带类型的图 DSL 将五维要素（角色、拓扑、消息模式、工具绑定、协调协议）统一为可编辑图程序，外环用运行时信号定位失败。Chrome 项目在约210个 agent、18角色、192并行探索，7天内发现10个零日、6个 CVE（含沙箱逃逸），AgentFlow 已开源。

BlockBeatNews

2026-04-23 06:51:01

Pembuatan abstrak sedang berlangsung

Menurut pemantauan Beating, tim Feng Yu dari UCSB bersama lembaga fuzz.land dan lainnya mengusulkan AgentFlow, sebuah program otomatis yang mensintesis banyak harness agen (mengatur pembagian peran agen, transmisi informasi, distribusi alat, dan logika pengulangan) untuk penemuan kerentanan. Makalah menunjukkan bahwa hanya dengan mengubah harness saat model tidak berubah, tingkat keberhasilan bisa meningkat beberapa kali lipat, tetapi solusi yang ada saat ini sebagian besar dibuat secara manual atau hanya mencari ruang desain lokal.

AgentFlow menggunakan DSL graf berjenis untuk menyatukan lima dimensi harness (peran, topologi, pola pesan, pengikatan alat, protokol koordinasi) menjadi program graf yang dapat diedit, dengan langkah tunggal dapat menambah atau mengubah agen, topologi, prompt, dan kumpulan alat secara bersamaan. Loop luar memanfaatkan sinyal runtime seperti cakupan program target dan laporan sanitizer untuk menentukan bagian yang gagal, menggantikan umpan balik biner melalui/ gagal. Di TerminalBench-2, dipadukan dengan Claude Opus 4.6 mencapai 84,3% (75/89), skor tertinggi sejenis di peringkat tersebut.

Di basis kode Chrome (35 juta baris C/C++), sistem mensintesis harness yang berisi 18 jenis peran, sekitar 210 agen, termasuk 7 analis sub-sistem, 192 penjelajah paralel, dan pipeline klasifikasi crash empat tahap, yang didedikasikan oleh agen khusus seperti Crash Filter dan Root Cause Analyzer untuk menghilangkan duplikasi berdasarkan tanda tangan crash ASAN yang unik. Menggunakan model sumber terbuka Kimi K2.5, dijalankan selama 7 hari di 192 unit H100, menemukan 10 kerentanan zero-day, semuanya dikonfirmasi oleh Chrome VRP. 6 di antaranya telah mendapatkan nomor CVE, meliputi WebCodecs, Proxy, Network, Codecs, Rendering, dengan tipe UAF, overflow bilangan bulat, dan overflow buffer heap, termasuk CVE-2026-5280 dan CVE-2026-6297 yang merupakan level Critical untuk pelarian sandbox.

Co-founder fuzz.land, Shou Chaofan, menyatakan bahwa beberapa kerentanan awalnya ditemukan menggunakan MiniMax M2.5, dan MiniMax M2.5 serta Opus 4.6 juga mampu menemukan sebagian besar. AgentFlow telah dirilis sebagai sumber terbuka.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
Gate13thAnniversaryLive
1.22M Popularitas
#
WCTCTradingChallengeShare8MUSDT
798K Popularitas
#
BitcoinBouncesBack
213.77K Popularitas
#
IsraelStrikesIranBTCPlunges
30.66K Popularitas
#
EthereumMemeSeasonReturns
2M Popularitas

Sematkan

peta situs

AgentFlow secara otomatis mensintesis sistem Multi-Agent untuk mengungkap celah zero-day pelarian sandbox Chrome

Topik Trending

Gate13thAnniversaryLive

WCTCTradingChallengeShare8MUSDT

BitcoinBouncesBack

IsraelStrikesIranBTCPlunges

EthereumMemeSeasonReturns

Sematkan