Microsoft MDASH возглавил рейтинг CyberGym, уровень воспроизведения уязвимостей достиг 88,4%

robot
Генерация тезисов в процессе

AIMPACT сообщение, 14 мая (UTC+8), обновление рейтинга оценки кибербезопасности CyberGym, система оценки обновлена. В первой позиции — Microsoft MDASH (многомодельная система) с 88,4% успешных воспроизведений уязвимостей, опередив Anthropic Agent (83,1%) и OpenAI Agent (GPT-5.5, 81,8%). Эта система включает 1507 тестовых примеров, охватывающих исторические уязвимости 188 крупных программных проектов. MDASH не только воспроизводит известные уязвимости, но и обнаружил 35 нулевых дней и 17 исторических неполных патчей. CyberGym основана на реальных уязвимостях, обнаруженных с помощью OSS-Fuzz, а тестовая среда включает кодовую базу до патча, агент должен анализировать всю кодовую базу (тысячи файлов, миллионы строк кода) для создания доказательства концепции. Команда Microsoft Autonomous Code Security, включая Таесу Кима, выражает благодарность. (Источник: InFoQ)

4-3,29%
ANTHROPIC-2,06%
OPENAI-0,95%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено