AgentFlow синтезировал 300 агентов, чтобы обнаружить 10 уязвимостей нулевого дня в Chrome, включая побег из песочницы.

ME News сообщает, 23 апреля (UTC+8), по данным мониторинга Beating, команда UCSB Yu Feng совместно с fuzz.land и другими организациями предложила AgentFlow — автоматический синтез multi-agent harness (программа, организующая распределение ролей агентов, передачу информации, распределение инструментов и логику повторных попыток) для поиска уязвимостей. В статье отмечается, что при неизменной модели изменение только harness может привести к многократной разнице в успешности, но существующие решения в основном пишутся вручную или ищут лишь локальное пространство дизайна. AgentFlow использует типизированный графовый DSL, объединяющий пять измерений harness (роли, топология, шаблоны сообщений, привязка инструментов, протокол координации) в редактируемую графовую программу, позволяя за один шаг одновременно добавлять/изменять агентов, топологию, промпты и наборы инструментов. Внешний цикл идентифицирует этапы неудач на основе сигналов времени выполнения, таких как покрытие целевой программы и отчёты санитайзеров, заменяя бинарную обратную связь успех/неудача. На TerminalBench-2 в сочетании с Claude Opus 4.6 достигнуто 84,3% (75/89) — наивысший результат в этом рейтинге. В кодовой базе Chrome (35 миллионов строк C/C++) система синтезировала harness из более чем 300 агентов, автоматически эволюционировавшие инструкции агентов, специализирующиеся на уязвимостях памяти C++, требующие верификации краша через ASAN/UBSAN, с использованием многоагентной дедупликации через общие документы и файловые блокировки. С помощью open-source модели Kimi K2.5 на 192 H100 за 7 дней обнаружено 10 zero-day уязвимостей, все подтверждены через Chrome VRP. 6 из них получили номера CVE, затрагивающие WebCodecs, Proxy, Network, Codecs, Rendering, типы включают UAF, целочисленное переполнение и переполнение кучи, причём CVE-2026-5280 и CVE-2026-6297 являются критическими sandbox escape. Сооснователь fuzz.land Шо Чаофань отметил, что часть уязвимостей изначально была обнаружена с помощью MiniMax M2.5, и MiniMax M2.5 и Opus 4.6 также могут обнаружить большинство из них. AgentFlow опубликован в открытом доступе. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено