#Anthropic发布Fable5模型 一个模型,两个名字:Anthropic 发布 Fable 5 和 Mythos 5,最强模型首次向公众开放


6 月 9 日,Anthropic 同时发布了两款新模型——Claude Fable 5 和 Claude Mythos 5。有意思的是,它们底层其实是同一个模型,区别只在于"护栏"的松紧。这是 Anthropic 史上能力最强的模型首次向公众开放,也是一次罕见的"分级发布"实验。
这篇文章带你看懂:它强在哪、为什么要拆成两个名字、以及现在怎么用上它。
一、先搞清楚:什么是"Mythos 级"模型?
熟悉 Claude 的读者都知道,Anthropic 的模型一直分三档:Haiku(快)、Sonnet(均衡)、Opus(最强)。而今年 4 月,Anthropic 悄悄推出了一个凌驾于 Opus 之上的全新档位——Mythos 级。第一款 Mythos 级模型(Claude Mythos Preview)并没有公开发售,而是通过一个叫 Project Glasswing 的计划,与美国政府合作,只提供给少数网络安全防御机构和关键基础设施提供商。
原因很直白:这个级别的模型太强了,强到在网络攻击、生物研究等领域可能被滥用,Anthropic 认为不能直接放出来。
这次发布的两款模型,就是 Mythos 级的正式版本:
◆ Claude Fable 5:面向所有人开放的版本,自带一套新的安全护栏;
◆ Claude Mythos 5:护栏部分解除的版本,仅向 Glasswing 合作伙伴等受信任机构开放。两者是同一个底层模型。名字也起得讲究:Fable 来自拉丁语 fabula("被讲述之事"),与希腊语 mythos 同源——同根同源,区别只在"能不能畅所欲言"。
二、它到底有多强?
按 Anthropic 的说法,Fable 5 的能力超过了该公司有史以来公开发布的任何模型,在几乎所有 AI 能力基准测试上都是当前最先进水平(SOTA),尤其擅长软件工程、知识工作、视觉理解和科学研究。而且任务越长、越复杂,它对老模型的领先就越大。
写代码:把两个月压缩成一天。支付公司 Stripe 在早期测试中报告,在一个 5000 万行的 Ruby 代码库里,Fable 5 用一天完成了一次全代码库迁移——按原计划,这需要一整个团队手工干两个多月。在 Cognition(Devin 的开发商)的 FrontierCode 评测中,Fable 5 在前沿模型中得分最高,而且更省 token。
视觉:裸玩通关《宝可梦·火红》。此前的 Claude 模型玩宝可梦需要复杂的辅助工具(地图、导航、游戏状态信息)才能勉强推进,Fable 5 只靠看原始游戏画面就通关了全程。它还能从截图直接重建一个 Web 应用的源代码。
记忆:玩《杀戮尖塔》会做笔记了。在长达数百万 token 的任务中,Fable 5 能持续保持专注,并利用自己写下的笔记改进表现。在卡牌游戏《杀戮尖塔》的测试中,给它文件式持久记忆后,性能提升幅度是 Opus 4.8 的三倍。
科研:药物设计提速约 10 倍。Anthropic 内部的蛋白质设计专家用 Mythos 5 把药物设计的部分流程加速了约十倍——模型在无人协助的情况下,独立完成选择结合位点、运行蛋白设计工具、从失败中恢复等通常由科学家完成的全部环节。14 个蛋白靶点中有 9 个产出了值得继续推进的候选药物。它还提出了一个关于大肠杆菌蛋白质的全新机制假说,后来被一个独立研究同一问题的实验室证实。
三、护栏怎么工作:触发了就"降级"给 Opus 4.8这是整个发布中最值得玩味的设计。Fable 5 配备了一套新的安全分类器(classifiers)——独立于主模型之外的 AI 系统,专门检测潜在滥用。当分类器认为你的请求涉及以下三类敏感领域时,回答你的就不再是 Fable 5,而是自动切换为次强模型 Claude Opus 4.8(用户会收到提示):
1. 网络安全:Mythos 级模型极擅长发现和利用软件漏洞,还会"自主黑客"——侦察、横向移动一条龙。这些能力会让网络攻击的成本大幅降低,所以被重点看防。
2. 生物与化学:模型已经能完成真实世界的科研任务(比如预测病毒外壳组装),这种双重用途能力在坏人手里很危险,目前生化领域的大部分请求都会回退给 Opus。
3. 蒸馏攻击:防止有人大规模"抽取" Fable 5 的能力去训练竞品模型。
几个关键数字:护栏平均在不到 5% 的会话中触发,也就是说 95% 以上的用户全程用的就是接近 Mythos 5 的完整能力。Anthropic 承认护栏调得偏保守、会误伤无害请求,并表示会尽快降低误报。抗越狱方面,超过 1000 小时的外部漏洞悬赏测试中没有发现"万能越狱"。
另一个值得注意的变化:Mythos 级模型的所有流量将强制保留 30 天(包括企业客户),用于防御新型攻击和越狱——Anthropic 承诺这些数据不用于训练,并配套了访问审计等隐私保护措施。
四、Mythos 5:给"可信圈子"的无护栏版本Mythos 5 就是去掉部分护栏的 Fable 5,号称拥有全球最强的网络安全能力。它目前只通过 Project Glasswing 提供给网络防御机构,作为 Mythos Preview 的升级。接下来 Anthropic 计划逐步扩圈:与美国政府协商持续增加合作伙伴;推出更系统化的受信任访问计划,让网络安全组织可以申请;并为生物医学研究者开放一个生物版受信任计划(解除生化护栏、保留网络安全护栏),加速新疗法研发。这套"同一个模型、按身份分级解锁"的玩法,在前沿 AI 发布史上是头一次。
五、价格与上手:6 月 22 日前是"免费窗口期"API 定价:输入 $10 / 百万 token,输出 $50 / 百万 token——不到 Mythos Preview 的一半。模型标识符为 claude-fable-5,API 和按量付费的企业计划今天起全量可用。订阅用户要注意这个时间表:
◆ 即日起至 6 月 22 日:Pro、Max、Team 和企业版套餐免费内含 Fable 5;
◆ 6 月 23 日起:将从套餐中移除,继续使用需购买用量积分(usage credits);若容量允许,免费窗口可能延长;
◆ 之后:等算力跟上,Anthropic 打算把 Fable 5 重新纳入订阅套餐标配。换句话说,未来两周是白嫖最强模型的窗口期,感兴趣的读者不妨抓紧体验。
六、写在最后:能力与安全的"新解法"
过去几年,前沿实验室面对"模型太强怎么办"基本只有两个选项:延期发布,或者砍能力。Anthropic 这次给出了第三种答案——全量发布,但给公众版戴上动态护栏;同时为可信机构保留完整版。
这个方案不完美:5% 的误伤会让一部分专业用户(尤其是安全研究员和生物学者)感到挫败,30 天强制数据保留也会引发隐私讨论。但它确实让"最强能力"第一次没有被锁在政府合作项目里,而是以可控的方式进入了每个人的对话框。当 AI 能在一天内完成团队两个月的工程量、能独立设计蛋白质药物候选时,"怎么发布"本身已经和"做出来"同样重要。Fable 与 Mythos 这对同源词,或许会成为之后所有前沿模型发布的参照模板。
post-image
post-image
山顶传媒Ryak
#Anthropic发布Fable5模型 一个模型,两个名字:Anthropic 发布 Fable 5 和 Mythos 5,最强模型首次向公众开放

6 月 9 日,Anthropic 同时发布了两款新模型——Claude Fable 5 和 Claude Mythos 5。有意思的是,它们底层其实是同一个模型,区别只在于"护栏"的松紧。这是 Anthropic 史上能力最强的模型首次向公众开放,也是一次罕见的"分级发布"实验。
这篇文章带你看懂:它强在哪、为什么要拆成两个名字、以及现在怎么用上它。

一、先搞清楚:什么是"Mythos 级"模型?
熟悉 Claude 的读者都知道,Anthropic 的模型一直分三档:Haiku(快)、Sonnet(均衡)、Opus(最强)。而今年 4 月,Anthropic 悄悄推出了一个凌驾于 Opus 之上的全新档位——Mythos 级。第一款 Mythos 级模型(Claude Mythos Preview)并没有公开发售,而是通过一个叫 Project Glasswing 的计划,与美国政府合作,只提供给少数网络安全防御机构和关键基础设施提供商。
原因很直白:这个级别的模型太强了,强到在网络攻击、生物研究等领域可能被滥用,Anthropic 认为不能直接放出来。
这次发布的两款模型,就是 Mythos 级的正式版本:
◆ Claude Fable 5:面向所有人开放的版本,自带一套新的安全护栏;
◆ Claude Mythos 5:护栏部分解除的版本,仅向 Glasswing 合作伙伴等受信任机构开放。两者是同一个底层模型。名字也起得讲究:Fable 来自拉丁语 fabula("被讲述之事"),与希腊语 mythos 同源——同根同源,区别只在"能不能畅所欲言"。

二、它到底有多强?
按 Anthropic 的说法,Fable 5 的能力超过了该公司有史以来公开发布的任何模型,在几乎所有 AI 能力基准测试上都是当前最先进水平(SOTA),尤其擅长软件工程、知识工作、视觉理解和科学研究。而且任务越长、越复杂,它对老模型的领先就越大。
写代码:把两个月压缩成一天。支付公司 Stripe 在早期测试中报告,在一个 5000 万行的 Ruby 代码库里,Fable 5 用一天完成了一次全代码库迁移——按原计划,这需要一整个团队手工干两个多月。在 Cognition(Devin 的开发商)的 FrontierCode 评测中,Fable 5 在前沿模型中得分最高,而且更省 token。
视觉:裸玩通关《宝可梦·火红》。此前的 Claude 模型玩宝可梦需要复杂的辅助工具(地图、导航、游戏状态信息)才能勉强推进,Fable 5 只靠看原始游戏画面就通关了全程。它还能从截图直接重建一个 Web 应用的源代码。
记忆:玩《杀戮尖塔》会做笔记了。在长达数百万 token 的任务中,Fable 5 能持续保持专注,并利用自己写下的笔记改进表现。在卡牌游戏《杀戮尖塔》的测试中,给它文件式持久记忆后,性能提升幅度是 Opus 4.8 的三倍。
科研:药物设计提速约 10 倍。Anthropic 内部的蛋白质设计专家用 Mythos 5 把药物设计的部分流程加速了约十倍——模型在无人协助的情况下,独立完成选择结合位点、运行蛋白设计工具、从失败中恢复等通常由科学家完成的全部环节。14 个蛋白靶点中有 9 个产出了值得继续推进的候选药物。它还提出了一个关于大肠杆菌蛋白质的全新机制假说,后来被一个独立研究同一问题的实验室证实。

三、护栏怎么工作:触发了就"降级"给 Opus 4.8这是整个发布中最值得玩味的设计。Fable 5 配备了一套新的安全分类器(classifiers)——独立于主模型之外的 AI 系统,专门检测潜在滥用。当分类器认为你的请求涉及以下三类敏感领域时,回答你的就不再是 Fable 5,而是自动切换为次强模型 Claude Opus 4.8(用户会收到提示):
1. 网络安全:Mythos 级模型极擅长发现和利用软件漏洞,还会"自主黑客"——侦察、横向移动一条龙。这些能力会让网络攻击的成本大幅降低,所以被重点看防。
2. 生物与化学:模型已经能完成真实世界的科研任务(比如预测病毒外壳组装),这种双重用途能力在坏人手里很危险,目前生化领域的大部分请求都会回退给 Opus。
3. 蒸馏攻击:防止有人大规模"抽取" Fable 5 的能力去训练竞品模型。
几个关键数字:护栏平均在不到 5% 的会话中触发,也就是说 95% 以上的用户全程用的就是接近 Mythos 5 的完整能力。Anthropic 承认护栏调得偏保守、会误伤无害请求,并表示会尽快降低误报。抗越狱方面,超过 1000 小时的外部漏洞悬赏测试中没有发现"万能越狱"。
另一个值得注意的变化:Mythos 级模型的所有流量将强制保留 30 天(包括企业客户),用于防御新型攻击和越狱——Anthropic 承诺这些数据不用于训练,并配套了访问审计等隐私保护措施。

四、Mythos 5:给"可信圈子"的无护栏版本Mythos 5 就是去掉部分护栏的 Fable 5,号称拥有全球最强的网络安全能力。它目前只通过 Project Glasswing 提供给网络防御机构,作为 Mythos Preview 的升级。接下来 Anthropic 计划逐步扩圈:与美国政府协商持续增加合作伙伴;推出更系统化的受信任访问计划,让网络安全组织可以申请;并为生物医学研究者开放一个生物版受信任计划(解除生化护栏、保留网络安全护栏),加速新疗法研发。这套"同一个模型、按身份分级解锁"的玩法,在前沿 AI 发布史上是头一次。

五、价格与上手:6 月 22 日前是"免费窗口期"API 定价:输入 $10 / 百万 token,输出 $50 / 百万 token——不到 Mythos Preview 的一半。模型标识符为 claude-fable-5,API 和按量付费的企业计划今天起全量可用。订阅用户要注意这个时间表:
◆ 即日起至 6 月 22 日:Pro、Max、Team 和企业版套餐免费内含 Fable 5;
◆ 6 月 23 日起:将从套餐中移除,继续使用需购买用量积分(usage credits);若容量允许,免费窗口可能延长;
◆ 之后:等算力跟上,Anthropic 打算把 Fable 5 重新纳入订阅套餐标配。换句话说,未来两周是白嫖最强模型的窗口期,感兴趣的读者不妨抓紧体验。

六、写在最后:能力与安全的"新解法"
过去几年,前沿实验室面对"模型太强怎么办"基本只有两个选项:延期发布,或者砍能力。Anthropic 这次给出了第三种答案——全量发布,但给公众版戴上动态护栏;同时为可信机构保留完整版。
这个方案不完美:5% 的误伤会让一部分专业用户(尤其是安全研究员和生物学者)感到挫败,30 天强制数据保留也会引发隐私讨论。但它确实让"最强能力"第一次没有被锁在政府合作项目里,而是以可控的方式进入了每个人的对话框。当 AI 能在一天内完成团队两个月的工程量、能独立设计蛋白质药物候选时,"怎么发布"本身已经和"做出来"同样重要。Fable 与 Mythos 这对同源词,或许会成为之后所有前沿模型发布的参照模板。
repost-content-media
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论