AgentFlow синтезував 300 агентів, які виявили 10 Chrome-вразливостей нульового дня, включаючи обхід пісочниці.

ME News повідомляє, 23 квітня (UTC+8), за даними моніторингу Beating, команда UCSB Yu Feng спільно з fuzz.land та іншими організаціями представила AgentFlow, який автоматично синтезує багатоагентні harness (програми, що організовують розподіл ролей агентів, передачу інформації, розподіл інструментів та логіку повторних спроб) для виявлення вразливостей. Дослідницька робота вказує, що при незмінній моделі зміна harness може збільшити різницю в успішності в кілька разів, але існуючі рішення в основному створюються вручну або досліджують лише локальний простір дизайну. AgentFlow використовує типізований графовий DSL для об'єднання п'яти вимірів harness (ролі, топологія, схема повідомлень, прив'язка інструментів, координаційний протокол) у редаговану графову програму, де одним кроком можна одночасно додавати/змінювати агентів, топологію, промпти та набори інструментів. Зовнішній цикл визначає етапи невдачі на основі сигналів виконання з цільової програми, таких як покриття та звіти sanitizer, замінюючи двійковий зворотний зв'язок успіху/невдачі. На TerminalBench-2 у поєднанні з Claude Opus 4.6 досягнуто 84.3% (75/89), що є найвищим балом у цьому рейтингу. У кодовій базі Chrome (35 мільйонів рядків C/C++) система синтезувала harness, що складається з понад 300 агентів, де автоматично еволюціоновані інструкції агентів спеціалізуються на вразливостях пам'яті C++, вимагаючи підтвердження збоїв за допомогою ASAN/UBSAN, а багато агентів використовують спільні документи та файлові блокування для дедуплікації. За допомогою відкритої моделі Kimi K2.5 на 192 H100 протягом 7 днів було виявлено 10 zero-day вразливостей, усі підтверджені через Chrome VRP. 6 отримали номери CVE, що стосуються WebCodecs, Proxy, Network, Codecs, Rendering, типи включають UAF, цілочисельне переповнення та переповнення купи, причому CVE-2026-5280 та CVE-2026-6297 є втечами з пісочниці критичного рівня. Співзасновник fuzz.land Шоу Чаофань заявив, що деякі вразливості спочатку були виявлені за допомогою MiniMax M2.5, а MiniMax M2.5 та Opus 4.6 також можуть виявити більшість. AgentFlow вже відкритий. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено