AgentFlow синтезировал 300 агентов и обнаружил 10 zero-day уязвимостей в Chrome, включая побег из песочницы.

ME News сообщает, 23 апреля (UTC+8), по данным мониторинга Dongcha Beating, команда UCSB Yu Feng совместно с fuzz.land и другими организациями представила AgentFlow — систему автоматической генерации мульти-агентных harness (программ, координирующих роли агентов, передачу информации, распределение инструментов и логику повторных попыток) для обнаружения уязвимостей. В статье указано, что при неизменной модели изменение только harness может привести к многократной разнице в успешности, но существующие решения в основном создаются вручную или ищут только локальное пространство дизайна. AgentFlow использует типизированный графовый DSL, объединяющий пять измерений harness (роли, топология, шаблоны сообщений, привязка инструментов, протокол координации) в редактируемую графовую программу, позволяя за один шаг одновременно добавлять или изменять агентов, топологию, промпты и наборы инструментов. Внешний цикл определяет этапы сбоя на основе сигналов времени выполнения, таких как покрытие целевой программы и отчёты санитайзеров, заменяя бинарную обратную связь успеха/неудачи. На TerminalBench-2 в сочетании с Claude Opus 4.6 показатель достиг 84,3% (75/89), что является наивысшим результатом среди аналогов в этом рейтинге. В кодовой базе Chrome (35 миллионов строк C/C++) система синтезировала harness, состоящий более чем из 300 агентов; автоматически эволюционировавшие инструкции агентов были нацелены на уязвимости безопасности памяти C++ с требованием верификации крахов через ASAN/UBSAN, а мульти-агенты дедуплицировались через общие документы и файловые блокировки. С использованием открытой модели Kimi K2.5 на 192 графических процессорах H100 в течение 7 дней было обнаружено 10 уязвимостей нулевого дня, все подтверждённые Chrome VRP. 6 из них получили номера CVE, затрагивающие WebCodecs, Proxy, Network, Codecs, Rendering, с типами UAF, целочисленное переполнение и переполнение кучи, причём CVE-2026-5280 и CVE-2026-6297 являются критическими побегами из песочницы. Сооснователь fuzz.land Шоу Чаофань сообщил, что некоторые уязвимости изначально были обнаружены с помощью MiniMax M2.5, а MiniMax M2.5 и Opus 4.6 также способны обнаружить большинство из них. AgentFlow открыт в исходном коде. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено