AgentFlow синтезировал 300 агентов, нашел 10 нулевых дней уязвимостей Chrome, включая побег из песочницы.

ME News сообщение, 23 апреля (UTC+8), по данным мониторинга Beating, команда Yu Feng из UCSB совместно с fuzz.land и другими организациями предложила AgentFlow — автоматическую синтезацию multi-agent harness (программы, координирующей распределение ролей агентов, передачу информации, распределение инструментов и логику повторных попыток) для обнаружения уязвимостей. В статье отмечается, что при неизменной модели изменение только harness может привести к разнице в успешности в несколько раз, но существующие решения в основном пишутся вручную или ищут только локальное пространство дизайна. AgentFlow использует типизированный графовый DSL для унификации пяти измерений harness (роли, топология, шаблоны сообщений, привязка инструментов, протокол координации) в редактируемую графовую программу, позволяя за один шаг одновременно добавлять/изменять агентов, топологию, промпты и наборы инструментов. Внешний цикл на основе сигналов времени выполнения, таких как покрытие целевой программы и отчёты санитайзеров, определяет неудачные этапы, заменяя бинарную обратную связь "пройдено/не пройдено". На TerminalBench-2 в сочетании с Claude Opus 4.6 достигнуто 84.3% (75/89), что является наивысшим баллом среди аналогичных в этом рейтинге. В кодовой базе Chrome (35 миллионов строк C/C++) система синтезировала harness, состоящий из более 300 агентов, автоматически эволюционировавшие инструкции агентов, специализирующиеся на уязвимостях памяти C++, с требованием проверки крахов через ASAN/UBSAN, многоагентное взаимодействие через общие документы и файловые блокировки для дедупликации. С использованием открытой модели Kimi K2.5 на 192 H100 в течение 7 дней обнаружено 10 уязвимостей нулевого дня, все подтверждены Chrome VRP. 6 получили номера CVE, затрагивающие WebCodecs, Proxy, Network, Codecs, Rendering, типы включают UAF, целочисленное переполнение и переполнение кучи, из них CVE-2026-5280 и CVE-2026-6297 — критические побеги из песочницы. Сооснователь fuzz.land Шо Чаофань заявил, что часть уязвимостей изначально была обнаружена с помощью MiniMax M2.5, MiniMax M2.5 и Opus 4.6 также могут обнаружить большинство. AgentFlow уже открыт. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено