📢 Gate 广场认证创作者招募中,入驻瓜分每月 $20,000 创作大奖!
📌 参与方式
站内创作者: 成功申请“创作者认证徽章”即可自动参与。
新入驻创作者: 需填写入驻表单申请 👉️ https://www.gate.com/questionnaire/7698
🎁 创作者福利
1️⃣ 首帖见面礼: 新入驻/回归创作者发首帖,即得 $50U 奖励!
2️⃣ 周度发帖奖: 完成周发帖任务,轻松瓜分 $10,000 奖池!
3️⃣ 月度创作奖: 赛道更多样,完成月度任务瓜分 $1,600 GT 奖池!
4️⃣ 专属推广任务:进入专属创作者社群,享专属推广任务和节日礼包!
让您的优质内容被更多人看到,携手共建高质量创作者社区!
活动细节:https://www.gate.com/announcements/article/51536
OpenAI的GPT-5.5在网络攻击能力方面与Claude Mythos相媲美:AI安全研究所
简要概述
英国政府机构发现,OpenAI 最新的人工智能模型能够自主执行复杂的网络攻击——它在仅仅10分钟内破解了一个由人类安全专家花费大约12小时完成的逆向工程挑战。 英国科学、创新与技术部下属的人工智能安全研究机构(AISI)周四公布的研究结果显示,GPT-5.5 是其评估过的最强攻击性网络能力模型之一,基本与Anthropic 推出的著名Claude Mythos相当。 报告指出,GPT-5.5 是第二个完成AISI最严苛测试——名为“最后的幸存者”的32步模拟企业网络攻击——的模型,在10次尝试中自主完成了其中2次。第一个达成这一里程碑的模型是Anthropic的Claude Mythos预览版,在10次尝试中完成了3次。
该企业网络模拟由网络安全公司SpecterOps协作构建,要求代理链式执行侦察、凭证盗取、跨多个Active Directory林的横向移动、通过CI/CD管道进行供应链枢纽,以及最终窃取受保护的内部数据库——AISI估算,这些步骤由人类专家大约需要20小时完成。 或许最令人震惊的结果是一个极其困难的逆向工程谜题。GPT-5.5 在10分钟22秒内解决了这一挑战——该挑战要求重建定制虚拟机的指令集、从零编写反汇编器,并通过约束求解恢复密码——耗费API调用成本1.73美元。而人类专家使用专业工具大约需要12小时。 在AISI一系列高级网络安全任务中,GPT-5.5在最难的“专家”级别任务中平均通过率达71.4%,略高于Mythos预览版的68.6%,远超GPT-5.4的52.4%。
这些发现对人工智能发展的整体轨迹具有深远影响。AISI总结认为,GPT-5.5的表现表明,网络能力的快速提升可能是一个普遍趋势,而非孤立的突破——并警告称,如果攻击性网络技能是推理、编码和自主任务完成等更广泛能力提升的副产品,那么未来的进展可能会接连到来。 报告还指出了模型安全防护措施的重大担忧。研究人员发现了一种通用的越狱方法,能在所有测试的恶意网络查询中引发有害内容,包括多轮交互设置。这一攻击由专家团队花费六小时开发。OpenAI随后更新了其安全防护措施,但配置问题导致AISI无法验证最终版本是否有效。 AISI警告称,其能力评估是在受控研究环境中进行的,未必反映普通用户的实际可用情况,指出公开部署中还包括额外的安全措施和访问控制。 该报告发布之际,英国网络安全形势令人担忧。英国政府周四公布的年度网络安全漏洞调查显示,过去12个月内,43%的企业遭遇了网络攻击或漏洞。 作为回应,政府宣布投入9000万英镑的新资金以增强网络韧性,并表示将推进《网络安全与韧性法案》,以保护关键基础设施。官员们还发布指南,敦促组织为AI加速漏洞发现和利用带来的潜在安全漏洞激增做好准备。