大白话讲透王炸Fable 5与Mythos 5: 它能替你干什么

作者:硅谷Alan Walker

别再把它当会聊天的机器人了。今天 Claude 发布的东西,能一天改完五千万行代码、能自己造一个软件再用它建模、能自己做基因组研究还赢了《Science》上的论文。这篇没有术语,用最实在的话,把 "它到底能干啥、对你我有啥用" 一件件讲清楚。

早上七点四十,California Avenue 还没醒透。咖啡刚冲出来,我把手机立在糖罐边 —— 屏幕里是一张奶油色的图,几十只蝴蝶标本拼成一个大大的「5」。标题就一行: Claude Fable 5 and Claude Mythos 5, 底下一句话: "我们做出了一个安全到可以给所有人用的神话级模型。”

我把官网那篇公告从头到尾读了两遍,越读越坐不住。不是因为又一个模型分数更高了,是因为里面那一串它**真干成的事,**已经不像是一个更聪明的聊天框该干的了。它更像是你雇了一个不睡觉、不喊累、还啥都会一点的数字员工。这篇咱们就聊聊,这个员工到底能替你干哪些活。

30 秒速读 · 先给结论

  • 今天 Anthropic 一口气发了俩。Fable 5: 给所有人用的、史上最强的公开版 Claude。Mythos 5: 跟它同一个大脑,但松了绑,只给极少数被信任的机构 (网络防御、政府、顶尖科研)。

  • 一天改完一个团队两个月的代码; 只看屏幕画面、不靠任何攻略,自己通关《宝可梦》;自己造一个 3D 建模软件,再用这软件去建模; 甚至自己写代码作了一首曲子,而它从没听过音乐。

  • 输入 $10、输出 $50(每百万 token),约 Opus 两倍。订阅用户 6 月 22 日前 免费随便用,过期要烧额度。

  • 它戴了"安全口罩": 碰到网络攻击、生物化学这类高危问题,会自动换成二把手 Opus 4.8 来答,大约 5% 的对话会撞上,偶尔会误伤正常需求。

「神话级」是个什么段位?为啥四月份不敢给、今天敢给了?

要看懂今天这事,先得有张段位表。过去我们熟悉的 Claude,从轻到重是这么排的: _Haiku _(小快灵,适合简单高频的活)、_Sonnet _(中坚,日常主力)、_Opus _(顶配,啃硬骨头)。这三档,大家用了好几年。而今年,Anthropic 在 Opus 之上,又硬生生加盖了一层全新的、更高的楼 —— 叫 **Mythos 级(神话级),**比最强的 Claude 还要再高一个数量级。它不是快了一点、准了一点的小升级,是换了个物种。

这个 Mythos 不是今天凭空蹦出来的,它有段挺戏剧化的前史。今年 4 月,Anthropic 先悄悄放了个预览版,叫 Mythos Preview。结果一测,自己先吓着了 —— 这模型在**"找软件漏洞、发起网络攻击"**上强到离谱,几乎能把主流操作系统和浏览器的安全缺口挨个挑出来。这种能力落到好人手里是救命的盾,落到坏人手里就是开锁的万能钥匙。于是他们没敢对公众开放,而是搞了个叫 Project Glasswing (玻璃翼计划) 的小圈子,只把它给极少数管关键基础设施的单位 —— 银行、电网、医疗、大软件公司 —— 拉上亚马逊、苹果、谷歌、微软、摩根大通这些巨头一起,让它们先用这把万能钥匙去把自家的锁加固。后来这个圈子慢慢扩到 约 150 家机构、15 多个国家。

那为啥四月不敢给、今天敢了? 关键不在模型变乖了,而在 护栏修好了。这两个月,Anthropic 一直在打磨一套 "安全闸门",直到它结实到自己觉得 "就算放给全世界,坏人也很难钻空子"。于是今天端上桌的,是两道菜: 一道叫 **Fable 5,**给全世界用,戴着那套刚修好的安全口罩; 另一道叫 Mythos 5, 把口罩摘掉一部分, 只留给信得过的人。

四月那次的潜台词是: "东西造出来了,但我们不敢给所有人。"今天这次的潜台词是: "栅栏终于修结实了,可以请大家进来了。"—— 变的从来不是能力,是那道门。

所以接下来这篇的主线就一条: **这道刚被放出笼子的 "神话级" 猛兽,到底能替我们干哪些以前想都不敢想的活? **它强,强在能 "动手做完整件事",而不只是 "陪你聊几句"。这才是它跟我们过去用的所有 AI 最本质的区别,也是下面五段要一件件给你看的东西。

Fable 和 Mythos 到底差在哪? 同一个人,两套出装

_这是全篇最容易被新闻标题带偏、却最该记牢的一点: _**Fable 5 和 Mythos 5,底层是同一个模型,同一颗脑子,同一套参数,一个零件都不差。**它俩绝不是 "低配版和高配版",也不是 "阉割版和满血版"。听上去反直觉,但官方白纸黑字写得清清楚楚: 两者用的是同一份权重,唯一的差别就是前面那层安全规矩挂得多还是少

打个比方你就懂了:

想象有一位全科顶级专家。第一种情况你让他穿上公司工牌、签好合规协议,坐到前台去接待所有上门的陌生人 —— 这就是 Fable。遇到敏感问题,他得按规矩来: "抱歉这个我不能细说,我帮您转接专员。" 第二种情况,同一个人脱了工牌,走进内部实验室,面对的是几个知根知底、信得过的同事,他就能彻底放开手脚,什么都敢深聊 —— 这就是 Mythos。

请注意: 从头到尾,人没换过,变的只是他身上那套规矩和他面对的人。同样一颗大脑,因为 "谁在用、在什么场合用",被包装成了两个产品。

更有意思的,是这两个名字本身就藏着设计者的小心思。Anthropic 在脚注里点了一句: Fable (寓言)来自拉丁语 fabula,意思是 "被讲出来的故事"; 而它跟希腊语的 mythos (神话), 其实是同一个词根长出来的兄弟。说白了,寓言和神话本就是一回事 —— 同一个故事,讲给不同的人听。给 大众 听的那一版,结尾要带个 "安全的教训", 这叫寓言; 给 祭司 听的那一版, 不设防、不掩饰, 这叫神话。

这家公司硬是把整套产品哲学焊进了命名学里。它在用最古老的方式告诉你 —— **同一份真相,会因为听者的身份不同,被讲成两个版本。**这句话,第八段我们还会回来看。

一天改完一个团队两个月的活, 这到底是什么概念?

先讲它最炸、也最实打实的一项本事: 写代码、改代码。这里有个真实案例,主角是大名鼎鼎的支付公司 Stripe。他们手里有一个 5000 万行 的老代码库 ——这是个什么体量? 你可以想象成一栋盖了十几年、住了无数租户、水管电线层层叠叠的超级老楼。现在要给整栋楼做一次 "全屋管线升级",把旧标准换成新标准,每一处都不能出错,否则整栋楼可能停水停电。这种活正常情况下得一整支工程师团队埋头干两个多月。

结果呢? Stripe 把这活丢给 Fable 5,它一天就干完了。不是写个 demo、不是改两个文件,是整个代码库范围的、牵一发动全身的大改造。这意味着什么? 过去你觉得这事太大、太烦、风险太高,排期排到明年也不一定动得了的那类硬骨头,现在可能一个晚上就啃完了。这不是 "提速 10%、20%" 的量变,是把两个月压缩成一天的质变。

而且它不只是快,还省。在一个专门考验代码质量的硬核测试 (Cognition 家的 FrontierCode) 里,它不仅分最高,还特别 "省脑力燃料" —— 术语叫 token 高效,意思是同样一道难题,它用更少的运算就解出来了,换算成钱和时间,就是更便宜、更快。更关键的是,它能在 "中等用力" 的档位就打赢别人 "全力以赴" 的成绩,等于一个高手不用使全力就赢了。

做代码编辑器的 Cursor 团队说,它在他们的测试里是最强的,直接打开了一类 "以前的模型根本够不着" 的超长难题。做代码托管的 GitHub 说,它能扛下复杂的、要连续干很久的编程任务,自主性和可靠性超出了他们的预期。做编程智能体的 Cognition 说,它是他们前沿编程测试上分数最高的,还能 "开箱即用" 地上手没见过的工具。

一个做 "用大白话造软件" 的平台 (Base44) 说: 一年前要来回调一百次提示词才能做出来的 App,现在它一次就给你做出来了。就是说你不会写代码也没关系,只要把你想要的东西说清楚,它就能直接把成品交给你。

把这些拼在一起看,你会发现一件正在发生的大事: **编程这件事的门槛,正在从 "会不会写" 变成 "说不说得清你要什么"。**而对真正的工程师,它则把人从一行行敲里解放出来,变成指挥一个能自己干活的数字工程队。无论你站在哪头,这一刀,都实打实地砍在了 "软件是怎么被造出来的" 这件事上。

读财报、改合同、啃图表, 白领的日常, 它一样能接

你可能会说: 写代码是程序员的事,跟我没关系。别急,这一段全是普通白领天天在干的活。先说 **"知识工作" **—— 也就是读资料、做分析、出结论这一类脑力活。在一个专门考 "资深分析师水平" 的金融测试 (Hebbia 家的) 里,Fable 5 拿了所有模型里的最高分,尤其擅长三件事: 读懂一大摞文件后做推理、看懂复杂的图表和表格、以及把问题真正解出来。另一家做交易的公司 (IMC) 更直接,说它几乎把所有交易分析的考题都做对了 —— 查事实、讲概念、找出问题的根因、算清楚一笔交易划不划算,样样都行。

再说一个更接地气的: 表格。做 Python 和数据工具出名的 Anaconda 测了它的 "日常表格套件",结论是它在每个用力档位上都赢过 Opus,而且还快了25%–30%,用的步骤更少。加班到深夜、几十个 sheet 互相勾稽、一改一处就崩一片的 Excel 噩梦,它能更快、更稳地帮你理清楚。还有一个让律师们坐直身子的细节: 一家公司让律师盲评它改合同的批注,结果发现它改的每一次都追平甚至超过了他们现用的工具

**它现在是处理看图任务最强的模型。**能从一张密密麻麻的科学图表里,精确读出具体数字 —— 这对科研、金融太有用了。更夸张的是: 你给它几张网页的截图,它能反推出这个网页背后的源代码,等于 "看一眼成品就把图纸还原出来"。

这个最直观: 它玩经典游戏《宝可梦·火红》,只看游戏的原始画面,不给地图、不给攻略、不给任何辅助提示,自己从头打到通关。要知道,以前的 Claude 得靠一大堆 "辅助轮子" 才能勉强玩,而它光靠 "一双眼睛" 就通关了。这说明它不只是 "认得图里有啥",而是能看懂局势、做规划、连续决策。

把代码、分析、看图这些硬指标摆一个最直观的对比: 在一个硬核软件工程测试(SWE-bench Pro)上,它拿 80.3 分,而 OpenAI 当前最强的通用模型 GPT-5.5 是 58.6 分; 在更讲究 "代码能不能上生产线" 的测试上,它 29.3 分,GPT-5.5 只有 5.7 分。数字本身不重要,重要的是这条规律 —— 任务越长、越复杂、越接近真实工作,它甩开对手就越远。陪你聊天它未必比别人强多少,但把一整摊真活儿压上去,它才露出獠牙。

它不再是答题,而是自己造工具、自己创作

前面两段还算高级一点的助手,这一段,是我读完整篇公告最后背发凉的地方 —— 因为它展示的已经不是 "回答问题",而是 "自己动手,从无到有造出一整个东西"。挑四个官方放出来的演示:

  • 从物理公式,推出日食发生的时刻:它自己写代码做了一个太阳系运行的模拟。注意,不是查资料告诉你日食啥时候发生,而是从最底层的物理定律出发,自己推算出行星怎么转,再用这套自推的规律,去预测日食会在何时上演。这是科学家做研究的路子——先建模型,再用模型预言现实。

  • 自己玩《Factorio》,从零建一座自动化工厂:《Factorio》是一款工程师圈子里出了名 "烧脑、会上瘾"的造工厂游戏: 你要规划流水线、安排物流、让整套系统自动运转。它自己上手玩,自己定策略,自己一砖一瓦搭出一座能自动运行的工厂。这考验的是长链条规划和系统设计 —— 不是手快,是脑子真的在运筹。

  • 先造一个 CAD 软件,再用它建模:这个堪称 "套娃级"炸裂:它在浏览器里设计出一个完整的、可 3D 打印的模型。但关键不在模型 —— 而在那个用来建模的 CAD 编辑器,也是它自己造的,连编辑器里那个帮你建模的 AI 小助手,都是它顺手写的。等于它先造了一台机床,再用这台机床造零件。工具和成品,一条龙全包了。

  • 写代码作了一首曲子,可它从没听过音乐:它做了一个流体模拟(水流晃动的动画),让水波的运动精准卡在一首古典 EDM 混音的节拍上。而那首曲子,是它纯用代码 "算" 出来的 —— 它从来没有听过任何声音,却靠对音乐结构的理解,把旋律和节奏写了出来。这已经不是模仿,是某种意义上的创作。

还有一个能力藏在这些演示背后,但同样关键 —— 记忆。它能在一个长达几百万字的超长任务里始终不跑偏,还会看自己之前记的笔记来改进后面的做法。官方让它去玩一款很吃策略和记忆的卡牌游戏《杀戮尖塔》,给它配一个能持续记笔记的 "记忆本" 之后,它打进游戏最终幕的概率,是 Opus 的三倍。它不再是金鱼记忆、聊完就忘,而是能像人一样,边干边总结经验,越干越顺手。

把这五段连起来看,一个分水岭已经很清楚了: 过去的 AI,是坐你旁边、帮你递工具的超级实习生; 现在这一代,是能自己拿起工具、自己规划、自己干完一整个项目、还会自己复盘的 "数字承包商"。你交给它的,从 "一个问题",变成了 "一件事"。

摘了口罩的 Mythos 5 有多猛?它在实验室里已经改写科学了

前面讲的都是戴着口罩的 Fable。那把口罩摘掉的 Mythos 5,放开手脚能干到什么地步? 这部分普通新闻很少讲,但恰恰是 "神话级" 三个字最沉的分量,也是 Anthropic 当初为什么那么紧张的原因。它已经不是做题家了,而是在真实的科学前线独立产出连人类专家都认账的新东西。

  • 设计新药,提速约十倍:Anthropic 内部做蛋白质设计 (新药研发的核心)的专家,用 Mythos 5 把部分流程加速了大约十倍。更惊人的是:在一个测试里,它全程没有人帮忙,自己选靶点、自己挑工具、自己跑流程、卡壳了自己想办法恢复 —— 把通常需要一位科学家完整操刀的活儿从头到尾自己干了一遍。结果在 14 个 蛋白靶点里,有 9 个 给出了值得继续往下做的候选药物方案。

  • 提出新假说,还被独立实验室证实了:它是头一个能稳定提出新颖又靠谱的科学假说的模型。科学家做盲评 (不知道哪个是 AI 提的),在分子生物学领域,有约 80% 的情况更偏爱它提的假说。其中关于一种大肠杆菌蛋白的全新机制,后来居然被另一个完全独立的实验室的研究证实了 —— 这意味着它提的不是看着像那么回事的废话,而是真能被现实验证的科学洞见。

  • 自己做基因组研究,赢了《Science》上的成果:给它一周多时间,基本无人看管,它自己整理了 138 个物种、数百万个细胞的数据,自己设计并训练了一个机器学习模型,用来识别 "在不同物种里扮演同一角色的细胞"。最后它训出来的模型,效果超过了一篇发表在《Science》上的成果 —— 而体积还小了 100 倍。一个被高人指点了几句的实习生干赢了顶级期刊。

  • 全世界最强的网络安全能力:官方直说它是当今地球上网络安全能力最强的模型 —— 能发现并利用几乎所有主流系统的漏洞。这正是它当初被关进笼子的原因: 同一身本事,给防守方是铜墙铁壁,给进攻方就是开锁神器。

看明白这一段,你就懂了那层安全口罩为什么必须存在。_一个能设计药物的 AI,反过来也可能被用来设计危险的东西;一个能修补漏洞的 AI,反过来也能被用来攻破系统。_它强到能救命,也就强到能伤人。

所以 Anthropic 的选择是: 把这身本事拆成两份 —— 给大众的 Fable,把最危险的几扇门焊死; 给可信者的 Mythos,在严格监管下才放开。这不是小气,是不得不。

那层口罩会不会天天误伤我?多少钱?啥时候轮到我?

先把安全口罩怎么干活讲清楚,因为很多人一听 "安全限制" 就脑补成 "动不动拒绝你"。其实这次的设计聪明得多。Fable 门口站着几个 "安检" (官方叫_分类器_),它们只盯三类高危话题 —— 网络攻击、生物化学、模型蒸馏(指偷偷把模型能力 "抄" 去训练别的模型)。一旦你的问题踩到这三条线,它不会把门一摔,而是 悄悄把这道题转给二把手 Opus 4.8 来回答。比如有人问 "怎么制造蓖麻毒素" 这种东西,Fable 自己闭嘴,Opus 4.8 给个安全的回应,系统也会明确告诉你 "刚才这题被转接了"。为什么不直接拒绝? 因为转给一个稍弱但够用的模型,体验总比甩你一句无法回答强。

那会不会动不动就误伤普通人? 会,但极少。官方说得很坦白: 这层口罩是 "宁可错杀也不放过" 的保守调法,所以不到 5%的对话会被转接,反过来说,95% 以上 的时候,你用到的就是满血能力 (跟 Mythos 5 没差别)。也就是说,你日常写代码、做表格、读文档、写文案,基本一辈子都碰不到那道闸门。**真会反复撞上的,是做安全研究、生物信息这类专业活儿的人。**顺带提一句安全成色: 官方做了 超 1000 小时 的外部悬赏测试,没人能找到 "通用越狱"; 哪怕用上 30 种公开的破解套路,它对策划网络攻击这类请求,一次都没松过口

讲完讲究,说最实在的 —— 钱和时间。Fable 5 和 Mythos 5 同价: 输入 $10 / 百万 token、输出 $50 / 百万 token。token 是啥: 粗略理解成 "把文字切成的小块",按块计费。这个价大约是 Opus 的两倍,但只有当初 Mythos Preview 的不到一半 —— 等于更强了,还更便宜了。开发者今天就能用,API 里的名字是 claude-fable-5

为啥这么折腾? 官方反复念叨一个词: 产能(capacity)。意思是这模型太能耗算力,他们怕一开放需求直接爆掉,只能先免费让大家尝个鲜、再阶段性收紧、等扩容了再彻底放开。至于 Mythos 5(放开版),普通人买不到 —— 它只给 Glasswing 的网络安全伙伴 (还要配合美国政府),接下来会给一小批生物科研机构。想进靠的是 "资格审核",不是你有多少钱。还有个容易忽略但重要的细节: 所有 Mythos 级的企业流量,对话要留存 30 天用于安全监控(不拿去训练模型)。

这对你我到底意味着啥?顺便留三个清醒的问号

把前面七段收口,落到最实在的 "那我该干啥"。

普通人别被术语吓住,你要做的特别简单 —— 趁 6 月 22 日前,去你的 Claude 订阅里把 Fable 5 选出来,拿你手头一件真活试一把: 写一份复杂的报告、改一段代码、把一摞 PDF 丢给它做分析、或者干脆把你脑子里那个 "一直想做但不会做" 的小工具描述给它。你会亲身体会到那个分水岭 —— "把一整件事交给它" 和 "让它帮个小忙",完全是两种感觉。这一下,胜过看十篇测评。

做产品、创业的人机会有两类。一是 "长任务" —— 以前你不敢交给 AI 的、要连续干好几天、中途无数岔路的复杂活,现在该重新评估了,因为它真能扛下来。二是那被误伤的 5% —— 如果你做的是安全、生物信息这类正经专业方向,谁能拿到 Mythos 5 的可信访问资格,谁就握住了一段别人摸不到的能力差,而能力差就是利润。

看投资的人把估值模型里 "模型多强" 的权重往下调一点,把 "能不能安全、规模化地把它部署出去" 往上提一点 —— 能力在变便宜,而 "驯服能力、敢放给公众" 的本事,正在变成真正的护城河。

但一个成熟的读者,得同时看见硬币的另一面。这里留三个清醒的问号。

**其一,"六十天悖论"。**两个月前还说太危险不能公开,今天就端上桌 —— 变的不是模型的危险性,是护栏的工程进度。这提醒我们,所谓安全是个不断打补丁的过程,不是一劳永逸的保证。

**其二,"一边喊刹车,一边踩油门"。**就在发布前不久,Anthropic 还公开呼吁各大公司给前沿 AI 研发装个共同的刹车,警告系统可能快要能自己改进自己;转头就放出了史上最强的公开模型。这姿态是真矛盾,还是商业与安全的微妙平衡,见仁见智。

**其三,"这是安全,还是权力集中?" **最强的"放开版"只给政府和大机构 (有报道称美国国安局正准备把 Mythos 用于网络行动),而广大普通防御者却用不到顶级网安能力 —— 再加上那条 30 天数据留存,有人就质疑这套安全叙事,会不会其实是把最强的力量,悄悄圈进了少数人手里?

看懂一个王炸产品的成熟标志,是你能同时为它的强大而兴奋,又对它的代价保持清醒。

窗外 California Avenue 终于热闹起来,几个穿连帽衫的工程师端着冰美式往 office 走,大概率,他们今天的第一件事,就是把 Fable 5 接进自己手头的活儿里。那只奶油色背景上的蝴蝶「5」还停在我手机屏上。

记住今天这个日子吧,这是能自己动手干完整件事的前沿 AI,第一次摘下大半张面纱,公开走到我们面前。**一个版本戴着口罩交给你我,一个版本摘了口罩留给少数人。你站在哪一层,不只看钱包,更看资格。**而我们这代人,正好坐在这道分界线被画下来的那一刻。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论