AgentFlow синтезував 300 агентів та виявив 10 вразливостей нульового дня в Chrome, включаючи обхід пісочниці.

ME News повідомлення, 23 квітня (UTC+8), за даними моніторингу Beating, команда UCSB Yu Feng спільно з fuzz.land та іншими організаціями запропонували AgentFlow, автоматичний синтез багатоагентного harness (програма, яка оркеструє розподіл ролей агентів, передачу інформації, розподіл інструментів і логіку повторних спроб) для виявлення вразливостей. У статті зазначається, що при незмінній моделі зміна лише harness може змінити рівень успіху в декілька разів, але існуючі рішення в основному створюються вручну або досліджують лише локальний простір дизайну. AgentFlow використовує типізований графовий DSL, щоб об'єднати п'ять вимірів harness (роль, топологія, шаблон повідомлень, прив'язка інструментів, протокол координації) в редаговану графову програму, яка може одночасно додавати/змінювати агенти, топологію, prompt та набір інструментів за один крок. Зовнішній цикл визначає невдалі етапи з сигналів виконання, таких як покриття цільової програми та звіти sanitizer, замінюючи бінарний зворотний зв'язок успіх/невдача. На TerminalBench-2 у поєднанні з Claude Opus 4.6 досягнуто 84.3% (75/89), що є найвищим показником серед аналогів у цьому рейтингу. У коді Chrome (35 мільйонів рядків C/C++) система синтезувала harness, що складається з понад 300 агентів, автоматично еволюціонуючи інструкції агентів, спрямовані на вразливості пам'яті C++, вимагаючи підтвердження збоїв за допомогою ASAN/UBSAN, багато агентів використовують спільні документи та файлові блокування для дедуплікації. Використовуючи відкриту модель Kimi K2.5 на 192 H100 протягом 7 днів, виявлено 10 вразливостей нульового дня, всі підтверджені Chrome VRP. 6 отримали номери CVE, що стосуються WebCodecs, Proxy, Network, Codecs, Rendering, типи включають UAF, цілочисельне переповнення та переповнення купі, серед яких CVE-2026-5280 і CVE-2026-6297 є критичними втечами з пісочниці. Співзасновник fuzz.land Шо Чаофань зазначив, що деякі вразливості спочатку були виявлені за допомогою MiniMax M2.5, і MiniMax M2.5 та Opus 4.6 також можуть виявити більшість. AgentFlow є відкритим. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено