Microsoft MDASH очолив рейтинг CyberGym, рівень відтворення вразливостей досяг 88,4%

robot
Генерація анотацій у процесі

AIMPACT повідомлення, 14 травня (UTC+8), оновлений рейтинг рамки оцінки кібербезпеки CyberGym, системи Microsoft MDASH (багатомодельна система) посідає перше місце з 88,4% успішності відтворення вразливостей, випереджаючи Anthropic Agent (83,1%) та OpenAI Agent (GPT-5.5, 81,8%). Ця рамка містить 1507 тестових прикладів, охоплюючи історичні вразливості 188 великих програмних проектів. MDASH не лише відтворює відомі вразливості, а й виявляє 35 нуль-денних вразливостей та 17 історичних неповних патчів. CyberGym побудовано на основі реальних вразливостей, знайдених за допомогою OSS-Fuzz, а середовище оцінки включає кодову базу до патчу, агент має робити висновки про всю кодову базу (тисячі файлів, мільйони рядків коду) для створення концептуальної демонстрації. Команда Microsoft Autonomous Code Security, включаючи Таесу Кіма, отримала подяки. (Джерело: InFoQ)

4-2,44%
ANTHROPIC-2,13%
OPENAI-0,47%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено