GPT-5.5-Cyber 资安能力打败 Claude Mythos!白宫放行 vs 被封杀两种命运

OpenAI 推出最新网络安全模型 GPT-5.5-Cyber,在 UC Berkeley CyberGym 基准测试中以 85.6% 超越 Anthropic 遭美政府停用之 Mythos 5(83.8%)。OpenAI 的 Daybreak 计划已与七国及欧盟网络安全机构合作,并联手 CrowdStrike、Cisco 等 28 家资安厂商整合产品,走出与 Anthropic 截然不同的监管路线。
(前情提要:OpenAI 推出网络安全专用模型 GPT-5.4-Cyber:已修补 3,000 个高危漏洞,较劲 Claude Mythos)
(背景补充:Anthropic Fable 5 被川普盯上,谁在后台偷笑?媒体揭三大受益者)

本文目录

Toggle

  • 同一能力、两种命运:白宫为何放行 OpenAI 却封杀 Anthropic?
  • 自我预言实现?Anthropic 的诚实困境与政策代价
  • 从修补漏洞到修补地球:OpenAI 防守生态圈成形

二○二六年六月,AI 安全竞赛出现戏剧性分裂。OpenAI 于 6 月 22 日正式发布 GPT-5.5-Cyber,作为其 Daybreak 网络防御计划最新旗舰模型。在 UC Berkeley 开发的 CyberGym 基准测试中,该测试将 AI 代理投入 1,507 个已知软件漏洞、横跨 188 个开源项目,GPT-5.5-Cyber 达到 85.6% 的复现率。

对照组令人玩味:Anthropic 的 Mythos 5 在同一排行榜上获得 83.8%,而 Anthropic 更广泛可用的 Claude Opus 4.7 则仅有 73.1%。不到两个百分点的差距在一般基准测试中或许不值一提,但背后的监管处境却截然不同,Mythos 5 与 Fable 5 在 6 月 12 日已被川普政府以《紧急出口管制指令》强制下架,至今仍处于离线状态。

同一能力、两种命运:白宫为何放行 OpenAI 却封杀 Anthropic?

Anthropic 的 Mythos 5 被勒令下架的直接导火线是一起 jailbreak 漏洞,这是一种绕过 AI 安全限制的技术,类比于找到高安全性门锁的万能钥匙。由于 Anthropic 无法大规模验证使用者国籍,最终选择对全球所有使用者关闭这两款模型。截至目前已超过十天,Anthropic 与美国商务部均未给出明确的恢复时间表。

但 OpenAI 的 GPT-5.5-Cyber 不仅仍在线运行,还获得了官方背书。OpenAI 在部署前已与联邦机构(包括 AI 标准与创新中心(Center for AI Standards and Innovation)及国家网络总监办公室(Office of the National Cyber Director))完成了预部署测试。换言之,OpenAI 选择先让政府点头再上线,而非如 Anthropic 先上线再被政府叫停。

这种“先审后发”的策略奏效。Daybreak 已与澳洲、加拿大、法国、德国、日本、韩国及欧盟机构(含 欧盟网络安全局 ENISA)签署网络安全合作协议。28 家资安厂商,包括 CrowdStrike、Cisco 和 Cloudflare,已加入其 Cyber Partner Program,将 GPT-5.5 整合进自家产品供认证客户使用。

自我预言实现?Anthropic 的诚实困境与政策代价

部分问题源于 Anthropic 自己种下的因。该公司花了数月将 Mythos 描述为“有史以来最强大、也最危险的 AI 模型之一”,并在其发布文件中明确警告:其网络安全能力若缺乏适当限制,可能造成严重危害。Anthropic 共同创办人 Dario Amodei 于 6 月 10 日发布的长文中,将前沿 AI 模型类比为飞机,认为安全监管机构在其未通过审计时应该能够将其停飞。数日后,政府真的让 Anthropic 的飞机停飞了。

更糟的是,同一周 Anthropic 还被爆出 Fable 5 中存在隐藏的审查过滤器:该模型会对怀疑在开发竞争对手的使用者静默降低输出质量。Anthropic 最终被迫道歉并撤回该政策,但公众信任已受损。

这与 OpenAI 的路线形成鲜明对比。OpenAI 的 GPT-5.5-Cyber 同样不对一般公众开放,仅提供给经过验证的安全专业人员;其限制程度与 Anthropic 对 Mythos 的管控不相上下,但 OpenAI 选择提前与政府完成监管沟通,而非事后被迫配合。

从修补漏洞到修补地球:OpenAI 防守生态圈成形

根据 OpenAI 官方部落格,Codex Security 工具自三月上线以来已扫描超过 3,000 万次 commit、覆盖 3 万个代码库,并记录超过 50 万个已修补漏洞。OpenAI 也推出“Patch the Planet”(修补地球)计划,协助修复广泛使用的开源项目中的安全漏洞。不仅防守自家系统,更主动加固全球软件供应链。

这场 AI 安全竞赛凸显了一个结构性矛盾:当最强大的模型同时也是最危险的模型时,诚实标示风险可能反噬自身。Anthropic 坦诚告知 Mythos 的破坏潜力,结果换来政府的全面禁令;OpenAI 采取类似的限制措施,却因先取得官方背书而得以继续运营。

截至 6 月 23 日,Fable 5 与 Mythos 5 仍处于离线状态,Anthropic 同时在与商务部协商,并对川普政府提起诉讼。而 OpenAI 的 Daybreak 计划正从网络防御延伸至国际合作,对比之下,两家公司的策略差异已不再仅是技术路线之争,更是 AI 监管时代的生存之道。、

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论