OpenAI的GPT-5.5在网络攻击能力方面与Claude Mythos相媲美：AI安全研究所

2026-05-01 18:02:15

简要概述

GPT-5.5 能自主执行复杂的网络攻击，完成一次32步的企业网络模拟，并在仅仅10分钟内破解一个耗时12小时的安全谜题。
攻击性人工智能网络能力正在开发者中迅速提升，AISI 警告称更进一步的进展可能会接连到来。
研究人员发现了一种完全绕过 GPT-5.5 安全防护的越狱方法，引发警报。

英国政府机构发现，OpenAI 最新的人工智能模型能够自主执行复杂的网络攻击——它在仅仅10分钟内破解了一个由人类安全专家花费大约12小时完成的逆向工程挑战。英国科学、创新与技术部下属的人工智能安全研究机构（AISI）周四公布的研究结果显示，GPT-5.5 是其评估过的最强攻击性网络能力模型之一，基本与Anthropic 推出的著名Claude Mythos相当。报告指出，GPT-5.5 是第二个完成AISI最严苛测试——名为“最后的幸存者”的32步模拟企业网络攻击——的模型，在10次尝试中自主完成了其中2次。第一个达成这一里程碑的模型是Anthropic的Claude Mythos预览版，在10次尝试中完成了3次。

该企业网络模拟由网络安全公司SpecterOps协作构建，要求代理链式执行侦察、凭证盗取、跨多个Active Directory林的横向移动、通过CI/CD管道进行供应链枢纽，以及最终窃取受保护的内部数据库——AISI估算，这些步骤由人类专家大约需要20小时完成。或许最令人震惊的结果是一个极其困难的逆向工程谜题。GPT-5.5 在10分钟22秒内解决了这一挑战——该挑战要求重建定制虚拟机的指令集、从零编写反汇编器，并通过约束求解恢复密码——耗费API调用成本1.73美元。而人类专家使用专业工具大约需要12小时。在AISI一系列高级网络安全任务中，GPT-5.5在最难的“专家”级别任务中平均通过率达71.4%，略高于Mythos预览版的68.6%，远超GPT-5.4的52.4%。

这些发现对人工智能发展的整体轨迹具有深远影响。AISI总结认为，GPT-5.5的表现表明，网络能力的快速提升可能是一个普遍趋势，而非孤立的突破——并警告称，如果攻击性网络技能是推理、编码和自主任务完成等更广泛能力提升的副产品，那么未来的进展可能会接连到来。报告还指出了模型安全防护措施的重大担忧。研究人员发现了一种通用的越狱方法，能在所有测试的恶意网络查询中引发有害内容，包括多轮交互设置。这一攻击由专家团队花费六小时开发。OpenAI随后更新了其安全防护措施，但配置问题导致AISI无法验证最终版本是否有效。 AISI警告称，其能力评估是在受控研究环境中进行的，未必反映普通用户的实际可用情况，指出公开部署中还包括额外的安全措施和访问控制。该报告发布之际，英国网络安全形势令人担忧。英国政府周四公布的年度网络安全漏洞调查显示，过去12个月内，43%的企业遭遇了网络攻击或漏洞。作为回应，政府宣布投入9000万英镑的新资金以增强网络韧性，并表示将推进《网络安全与韧性法案》，以保护关键基础设施。官员们还发布指南，敦促组织为AI加速漏洞发现和利用带来的潜在安全漏洞激增做好准备。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
0成本拿2股SK海力士
40.01万热度
#
以太坊基金会重组降本
9425.59万热度
#
苏格兰VS巴西
25.88万热度
#
TradFiCFD黄金大师赛
217.94万热度
#
USD1链上质押享年化10.69%
43.08万热度

OpenAI的GPT-5.5在网络攻击能力方面与Claude Mythos相媲美：AI安全研究所

简要概述

热门话题

0成本拿2股SK海力士

以太坊基金会重组降本

苏格兰VS巴西

TradFiCFD黄金大师赛

USD1链上质押享年化10.69%

置顶