AgentFlow синтезував 300 агентів і виявив 10 нульових днів у Chrome, включаючи втечу з пісочниці.

ME News повідомляє, 23 квітня (UTC+8), за даними моніторингу Beating, команда UCSB Yu Feng спільно з fuzz.land та іншими організаціями представила AgentFlow, який автоматично синтезує багатоагентний harness (програму, що оркеструє розподіл ролей агентів, передачу інформації, розподіл інструментів і логіку повторних спроб) для виявлення вразливостей.
У статті зазначається, що при незмінній моделі зміна лише harness'у може змінити успішність у кілька разів, але існуючі рішення здебільшого пишуться вручну або досліджують лише локальний простір дизайну.
AgentFlow використовує типізований графовий DSL, щоб об'єднати п'ять вимірів harness'у (ролі, топологію, шаблони повідомлень, прив'язку інструментів, протоколи координації) у редаговану графову програму, за один крок можна одночасно додавати/змінювати агентів, топологію, prompt'и та набори інструментів.
Зовнішній цикл визначає невдалі етапи з сигналів виконання, таких як покриття цільової програми та звіти санітайзерів, замінюючи двійковий зворотний зв'язок (успіх/невдача).
На TerminalBench-2 з Claude Opus 4.6 досягнуто 84,3% (75/89), що є найвищим показником у своїй категорії в цьому рейтингу.
На кодовій базі Chrome (35 млн рядків C/C++) система синтезувала harness з більш ніж 300 агентів, автоматично еволюціоновані інструкції агентів спеціалізуються на вразливостях пам'яті C++, вимагають підтвердження збоїв за допомогою ASAN/UBSAN, кілька агентів дедуплікуються через спільні документи та файлові блокування.
Використовуючи відкриту модель Kimi K2.5 на 192 H100 протягом 7 днів, було виявлено 10 вразливостей нульового дня, усі підтверджені через Chrome VRP.
6 отримали номери CVE, що стосуються WebCodecs, Proxy, Network, Codecs, Rendering, типи включають UAF, цілочисельне переповнення та переповнення купи, з яких CVE-2026-5280 та CVE-2026-6297 є втечами з пісочниці рівня Critical.
Співзасновник fuzz.land Шоу Чаофань заявив, що деякі вразливості спочатку були виявлені за допомогою MiniMax M2.5, а MiniMax M2.5 та Opus 4.6 також можуть виявити більшість.
AgentFlow має відкритий код.
(Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено