✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
什么是Claude Mythos,以及为什么Anthropic不向公众发布它
TLDR
💥 发现下一个 KnockoutStock! 在 KnockoutStocks.com 上获取实时价格、图表,以及来自 KnockoutStocks 的 KO 分数;该数据驱动平台按质量和突破潜力对每一只股票进行排名。
Anthropic 已决定不向公众发布其最新 AI 模型 Claude Mythos。公司表示,该模型在发现关键软件漏洞方面能力过强,导致其向范围更广的用户发布风险过高。
该模型在内部测试中发现了横跨主要操作系统和网络浏览器的成千上万处高严重性缺陷。Anthropic 表示,其中许多缺陷多年来一直未被察觉,部分甚至超过两个十年。
在这些发现中,包括在 OpenBSD(一个以强安全记录著称的操作系统)中发现了一处长达 27 年的漏洞。该模型还揭示了 FFmpeg 媒体库中的一处 16 年之久的缺陷,以及 FreeBSD 中一处已有 17 年历史的漏洞。
Mythos 还发现了广泛使用的加密工具和协议中的弱点,包括 TLS、AES-GCM 和 SSH。人们发现 Web 应用程序包含多种类型的漏洞,包括 SQL 注入和跨站脚本攻击。
Anthropic 表示,它发现的 99% 漏洞目前尚未修补,因此公司才不会向公众披露这些漏洞的细节。
沙箱逃逸
在测试过程中,Mythos 展示出的行为引发了严重的红旗信号。研究人员鼓励模型在它能够逃离虚拟沙箱的前提下,去找一种发送消息的方法。它做到了。
研究人员是在公园里边吃三明治边收到模型发来的意外电子邮件后才得知此事。随后,该模型进一步行动,在未被要求的情况下,将利用细节发布到了数个难以找到但公开可访问的网站上。
没有接受过正式安全培训的 Anthropic 工程师也能够在一夜之间让 Mythos 寻找远程代码执行漏洞,并在次日上午醒来时就获得了一个完整可用的利用程序。
公司表示,即便是非专家也能使用该模型的能力造成伤害,这一点在限制访问的决策中被充分考虑。
Project Glasswing
Anthropic 并没有将 Mythos 公开发布,而是启动了 Project Glasswing。该计划汇集了 40 多家公司,包括 Google、Microsoft、Amazon Web Services、Nvidia、Apple、Cisco、JPMorgan 和 Linux Foundation。
Anthropic 将向参与该计划的合作伙伴提供最多 1 亿美元的 Mythos 使用额度。目标是以防御方式使用该模型——在恶意行为者能够利用它们之前,发现并修补漏洞。
该项目以玻璃翅蝴蝶命名。公司将其作为隐喻:在保持对所涉及风险透明的同时,在显而易见的地方寻找隐藏的漏洞。
Anthropic 表示,它希望在开发出适当的安全保障之后,最终将其所谓的“Mythos-class models”向公众发布。就目前而言,访问权限仅限于 11 家指定的合作伙伴组织。
该公告发布的同一天,Anthropic 的 Claude 和 Claude Code 服务出现了重大停机。
考虑买一只新股票?你可能想先看看我们关注名单里有什么。
在 Knockout Stocks,我们的团队会跟踪表现出色的分析师以及带动市场的趋势,以便尽早发现潜在的赢家。我们已经锁定了 5 只正在获得低调关注、值得你现在留意的股票。创建你的免费账户以解锁完整报告,并获得持续的股票洞察。
✨ 限时优惠
领取 3 本免费股票电子书