微软MDASH登顶CyberGym排行榜,漏洞复现率达88.4%

robot
摘要生成中

AIMPACT 消息,5 月 14 日(UTC+8),CyberGym网络安全评估框架更新排行榜,微软MDASH(多模型系统)以88.4%的漏洞复现成功率排名第一,超过Anthropic Agent(83.1%)和OpenAI Agent(GPT-5.5,81.8%)。该框架包含1507个基准测试实例,涵盖188个大型软件项目的历史漏洞。MDASH不仅复现已知漏洞,还发现了35个零日漏洞和17个历史上不完整的补丁。CyberGym基于OSS-Fuzz发现的真实漏洞构建,评估环境包含补丁前代码库,代理需推理整个代码库(数千文件、数百万行代码)生成概念验证。微软Autonomous Code Security团队的Taesoo Kim等人获得致谢。(来源:InFoQ)

4-1.28%
ANTHROPIC-2.18%
OPENAI-0.57%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论