用白话讲透王炸Fable 5與Mythos 5:它能為你做什麼

作者:硅谷Alan Walker

別再把它當會聊天的機器人了。今天 Claude 發布的東西,能一天改完五千萬行程式碼、能自己造一個軟體再用它建模、能自己做基因組研究還贏了《Science》上的論文。這篇沒有術語,用最實在的話,把 "它到底能幹啥、對你我有啥用" 一件件講清楚。

早上七點四十,California Avenue 還沒醒透。咖啡剛沖出來,我把手機立在糖罐邊 —— 螢幕裡是一張奶油色的圖,幾十隻蝴蝶標本拼成一個大大的「5」。標題就一行: Claude Fable 5 和 Claude Mythos 5, 底下一句話: "我們做出了一個安全到可以給所有人用的神話級模型。”

我把官網那篇公告從頭到尾讀了兩遍,越讀越坐不住。不是因為又一個模型分數更高了,是因為裡面那一串它**真幹成的事,**已經不像是一個更聰明的聊天框該幹的了。它更像是你雇了一個不睡覺、不喊累、還啥都會一點的數字員工。這篇咱們就聊聊,這個員工到底能替你幹哪些活。

30 秒快讀 · 先給結論

  • 今天 Anthropic 一口氣發了俩。Fable 5: 給所有人用的、史上最強的公開版 Claude。Mythos 5: 跟它同一個大腦,但鬆了綁,只給極少數被信任的機構 (網路防禦、政府、頂尖科研)。

  • 一天改完一個團隊兩個月的程式碼; 只看螢幕畫面、不靠任何攻略,自己通關《寶可夢》;自己造一個 3D 建模軟體,再用這軟體去建模; 甚至自己寫程式作了一首曲子,而它從沒聽過音樂。

  • 輸入 $10、輸出 $50(每百萬 token),約 Opus 兩倍。訂閱用戶 6 月 22 日前 免費隨便用,過期要燒額度。

  • 它戴了"安全口罩": 遇到網路攻擊、生物化學這類高危問題,會自動換成二把手 Opus 4.8 來答,大約 5% 的對話會撞上,偶爾會誤傷正常需求。

「神話級」是個什麼段位?為啥四月不敢給、今天敢了?

要看懂今天這事,先得有張段位表。過去我們熟悉的 Claude,從輕到重是這麼排的: _Haiku _(小快靈,適合簡單高頻的活)、_Sonnet _(中堅,日常主力)、_Opus _(頂配,啃硬骨頭)。這三檔,大家用了好幾年。而今年,Anthropic 在 Opus 之上,又硬生生加蓋了一層全新的、更高的樓 —— 叫 **Mythos 级(神話級),**比最強的 Claude 還要再高一個數量級。它不是快了一點、準了一點的小升級,是換了個物種。

這個 Mythos 不是今天憑空蹦出來的,它有段挺戲劇化的前史。今年 4 月,Anthropic 先悄悄放了個預覽版,叫 Mythos Preview。結果一測,自己先嚇著了 —— 這模型在**"找軟體漏洞、發起網路攻擊"**上強到離譜,幾乎能把主流作業系統和瀏覽器的安全缺口挨個挑出來。這種能力落到好人手裡是救命的盾,落到壞人手裡就是開鎖的萬用鑰匙。於是他們沒敢對公眾開放,而是搞了個叫 Project Glasswing (玻璃翼計畫) 的小圈子,只把它給極少數管關鍵基礎設施的單位 —— 銀行、電網、醫療、大軟體公司 —— 拉上亞馬遜、蘋果、谷歌、微軟、摩根大通這些巨頭一起,讓它們先用這把萬用鑰匙去把自家的鎖加固。後來這個圈子慢慢擴到 約 150 家機構、15 多個國家。

那為啥四月不敢給、今天敢了? 关键不在模型變乖了,而在 護欄修好了。這兩個月,Anthropic 一直在打磨一套 "安全閘門",直到它結實到自己覺得 "就算放給全世界,壞人也很難鑽空子"。於是今天端上桌的,是兩道菜: 一道叫 **Fable 5,**給全世界用,戴著那套剛修好的安全口罩; 另一道叫 Mythos 5, 把口罩摘掉一部分, 只留給信得過的人。

四月那次的潛台詞是: "東西造出來了,但我們不敢給所有人。"今天這次的潛台詞是: "柵欄終於修結實了,可以請大家進來了。"—— 變的從來不是能力,是那道門。

所以接下來這篇的主線就一條: **這道剛被放出籠子的 "神話級"猛獸,到底能替我們幹哪些以前想都不敢想的活? **它強,強在能 "動手做完整件事",而不只是 "陪你聊幾句"。這才是它跟我們過去用的所有 AI 最本質的區別,也是下面五段要一件件給你看的東西。

Fable 和 Mythos 到底差在哪? 同一個人,兩套出裝

_這是全篇最容易被新聞標題帶偏、卻最該記牢的一點: _**Fable 5 和 Mythos 5,底層是同一個模型,同一顆腦袋,同一套參數,一個零件都不差。**它倆絕不是 "低配版和高配版",也不是 "閹割版和滿血版"。聽上去反直覺,但官方白紙黑字寫得清清楚楚: 兩者用的是同一份權重,唯一的差別就是前面那層安全規矩掛得多還是少

打個比方你就懂了:

想像有一位全科頂級專家。第一種情況你讓他穿上公司工牌、簽好合規協議,坐到前台去接待所有上門的陌生人 —— 這就是 Fable。遇到敏感問題,他得按規矩來: "抱歉這個我不能細說,我幫您轉接專員。" 第二種情況,同一個人脫了工牌,走進內部實驗室,面對的是幾個知根知底、信得過的同事,他就能徹底放開手腳,什麼都敢深聊 —— 這就是 Mythos。

請注意: 從頭到尾,人沒換過,變的只是他身上那套規矩和他面對的人。同樣一顆大腦,因為 "誰在用、在什麼場合用",被包裝成了兩個產品。

更有意思的,是這兩個名字本身就藏著設計者的小心思。Anthropic 在腳註裡點了一句: Fable (寓言)來自拉丁語 fabula,意思是 "被講出來的故事"; 而它跟希臘語的 mythos (神話), 其實是同一個詞根長出來的兄弟。說白了,寓言和神話本就是一回事 —— 同一個故事,講給不同的人聽。給 大眾 听的那一版,結尾要帶個 "安全的教訓", 這叫寓言; 給 祭司 听的那一版, 不設防、不掩飾, 這叫神話。

這家公司硬是把整套產品哲學焊進了命名學裡。它在用最古老的方式告訴你 —— **同一份真相,會因為聽者的身份不同,被講成兩個版本。**這句話,第八段我們還會回來看。

一天改完一個團隊兩個月的活, 這到底是什麼概念?

先講它最炸、也最實打實的一項本事: 寫程式、改程式碼。這裡有個真實案例,主角是大名鼎鼎的支付公司 Stripe。他們手裡有一個 5000 萬行 的舊程式碼庫 ——這是個什麼體量? 你可以想像成一棟蓋了十幾年、住了無數租戶、水管電線層層疊疊的超級老樓。現在要給整棟樓做一次 "全屋管線升級",把舊標準換成新標準,每一處都不能出錯,否則整棟樓可能停水停電。這種活正常情況得一整支工程師團隊埋頭幹兩個多月。

結果呢? Stripe 把這活丟給 Fable 5,它一天就幹完了。不是寫個 demo、不是改兩個檔案,是整個程式碼庫範圍的、牽一發動全身的大改造。這意味著什麼? 以前你覺得這事太大、太煩、風險太高,排期排到明年也不一定動得了的那類硬骨頭,現在可能一個晚上就啃完了。這不是 "提速 10%、20%" 的量變,是把兩個月壓縮成一天的質變。

而且它不只是快,還省。在一個專門考驗程式碼品質的硬核測試 (Cognition 家的 FrontierCode) 裡,它不僅分最高,還特別 "省腦力燃料" —— 術語叫 token 高效,意思是同樣一道難題,它用更少的運算就解出來了,換算成錢和時間,就是更便宜、更快。更關鍵的是,它能在 "中等用力" 的檔位就打贏別人 "全力以赴" 的成績,等於一個高手不用使全力就贏了。

做程式編輯器的 Cursor 團隊說,它在他們的測試裡是最強的,直接打開了一類 "以前的模型根本夠不著" 的超長難題。做程式托管的 GitHub 說,它能扛下複雜的、要連續幹很久的程式任務,自主性和可靠性超出了他們的預期。做程式智能體的 Cognition 說,它是他們前沿程式測試上分數最高的,還能 "開箱即用" 地上手沒見過的工具。

一個做 "用大白話造軟體" 的平台 (Base44) 說: 一年前要來回調一百次提示詞才能做出來的 App,現在它一次就給你做出來了。就是說你不會寫程式也沒關係,只要把你想要的東西說清楚,它就能直接把成品交給你。

把這些拼在一起看,你會發現一件正在發生的大事: **程式設計這件事的門檻,正在從 "會不會寫" 變成 "說不說得清你要什麼"。**而對真正的工程師,它則把人從一行行敲裡解放出來,變成指揮一個能自己幹活的數字工程隊。無論你站在哪頭,這一刀,都實打實地砍在了 "軟體是怎麼被造出來的" 這件事上。

讀財報、改合約、啃圖表, 白領的日常, 它一樣能接

你可能會說: 寫程式是程式員的事,跟我沒關係。別急,這一段全是普通白領天天在幹的活。先說 **"知識工作" **—— 也就是讀資料、做分析、出結論這一類腦力活。在一個專門考 "資深分析師水平" 的金融測試 (Hebbia 家的) 裡,Fable 5 拿了所有模型裡的最高分,尤其擅長三件事: 讀懂一大摞文件後做推理、看懂複雜的圖表和表格、以及把問題真正解出來。另一家做交易的公司 (IMC) 更直接,說它幾乎把所有交易分析的考題都做對了 —— 查事實、講概念、找出問題的根因、算清楚一筆交易划不划算,樣樣都行。

再說一個更貼近實務的: 表格。做 Python 和資料工具出名的 Anaconda 測了它的 "日常表格套件",結論是它在每個用力檔位上都贏過 Opus,而且還快了25%–30%,用的步驟更少。加班到深夜、幾十個 sheet 互相勾稽、一改一處就崩一片的 Excel 噩夢,它能更快、更穩地幫你理清楚。還有一個讓律師們坐直身子的細節: 一家公司讓律師盲評它改合約的批註,結果發現它改的每一次都追平甚至超過了他們現用的工具

**它現在是處理看圖任務最強的模型。**能從一張密密麻麻的科學圖表裡,精確讀出具體數字 —— 這對科研、金融太有用了。更誇張的是: 你給它幾張網頁的截圖,它能反推出這個網頁背後的源碼,等於 "看一眼成品就把圖紙還原出來"。

這個最直觀: 它玩經典遊戲《寶可夢·火紅》,只看遊戲的原始畫面,不給地圖、不給攻略、不給任何輔助提示,自己從頭打到通關。要知道,以前的 Claude 得靠一大堆 "輔助輪子" 才能勉強玩,而它光靠 "一雙眼睛" 就通關了。這說明它不只是 "認得圖裡有啥",而是能看懂局勢、做規劃、連續決策。

把程式碼、分析、看圖這些硬指標擺一個最直觀的對比: 在一個硬核軟體工程測試(SWE-bench Pro)上,它拿 80.3 分,而 OpenAI 當前最強的通用模型 GPT-5.5 是 58.6 分; 在更講究 "程式碼能不能上生產線" 的測試上,它 29.3 分,GPT-5.5 只有 5.7 分。數字本身不重要,重要的是這條規律 —— 任務越長、越複雜、越接近真實工作,它甩開對手就越遠。陪你聊天它未必比別人強多少,但把一整攤真活兒壓上去,它才露出獠牙。

它不再是答題,而是自己造工具、自己創作

前面兩段還算高級一點的助手,這一段,是我讀完整篇公告最後背發涼的地方 —— 因為它展示的已經不是 "回答問題",而是 "自己動手,從無到有造出一整個東西"。挑四個官方放出來的演示:

  • 從物理公式,推出日食發生的時刻:它自己寫程式做了一個太陽系運行的模擬。注意,不是查資料告訴你日食啥時候發生,而是從最底層的物理定律出發,自己推算出行星怎麼轉,再用這套自推的規律,去預測日食會在何時上演。這是科學家做研究的路子——先建模型,再用模型預言現實。

  • 自己玩《Factorio》,從零建一座自動化工廠:《Factorio》是一款工程師圈子裡出了名 "燒腦、會上癮"的造工廠遊戲: 你要規劃流水線、安排物流、讓整套系統自動運轉。它自己上手玩,自己定策略,自己一磚一瓦搭出一座能自動運行的工廠。這考驗的是長鏈條規劃和系統設計 —— 不是手快,是腦子真的在運籌。

  • 先造一個 CAD 軟體,再用它建模:這個堪稱 "套娃級"炸裂:它在瀏覽器裡設計出一個完整的、可 3D 打印的模型。但關鍵不在模型 —— 而在那個用來建模的 CAD 編輯器,也是它自己造的,連編輯器裡那個幫你建模的 AI 小助手,都是它順手寫的。等於它先造了一台機床,再用這台機床造零件。工具和成品,一條龍全包了。

  • 寫程式作了一首曲子,可它從沒聽過音樂:它做了一個流體模擬(水流晃動的動畫),讓水波的運動精準卡在一首古典 EDM 混音的節拍上。而那首曲子,是它純用程式 "算" 出來的 —— 它從來沒有聽過任何聲音,卻靠對音樂結構的理解,把旋律和節奏寫了出來。這已經不是模仿,是某種意義上的創作。

還有一個能力藏在這些演示背後,但同樣關鍵 —— 記憶。它能在一個長達幾百萬字的超長任務裡始終不跑偏,還會看自己之前記的筆記來改進後面的做法。官方讓它去玩一款很吃策略和記憶的卡牌遊戲《殺戮尖塔》,給它配一個能持續記筆記的 "記憶本" 之後,它打進遊戲最終幕的機率,是 Opus 的三倍。它不再是金魚記憶、聊完就忘,而是能像人一樣,邊幹邊總結經驗,越幹越順手。

把這五段連起來看,一個分水嶺已經很清楚了: 過去的 AI,是坐你旁邊、幫你遞工具的超級實習生; 現在這一代,是能自己拿起工具、自己規劃、自己幹完一整個專案、還會自己復盤的 "數字承包商"。你交給它的,從 "一個問題",變成了 "一件事"。

摘了口罩的 Mythos 5 有多猛?它在實驗室裡已經改寫科學了

前面講的都是戴著口罩的 Fable。那把口罩摘掉的 Mythos 5,放開手腳能幹到什麼地步? 這部分普通新聞很少講,但恰恰是 "神話級" 三個字最沉的分量,也是 Anthropic 當初為什麼那麼緊張的原因。它已經不是做題家了,而是在真實的科學前線獨立產出連人類專家都認帳的新東西。

  • 設計新藥,提速約十倍:Anthropic 內部做蛋白質設計 (新藥研發的核心)的專家,用 Mythos 5 把部分流程加速了大約十倍。更驚人的是:在一個測試裡,它全程沒有人幫忙,自己選靶點、自己挑工具、自己跑流程、卡殼了自己想辦法恢復 —— 把通常需要一位科學家完整操刀的活兒從頭到尾自己幹了一遍。結果在 14 個 蛋白靶點裡,有 9 個 給出了值得繼續往下做的候選藥物方案。

  • 提出新假說,還被獨立實驗室證實了:它是頭一個能穩定提出新穎又靠譜的科學假說的模型。科學家做盲評 (不知道哪個是 AI 提的),在分子生物學領域,有約 80% 的情況更偏愛它提的假說。其中關於一種大腸桿菌蛋白的全新機制,後來居然被另一個完全獨立的實驗室的研究證實了 —— 這意味著它提的不是看著像那麼回事的廢話,而是真能被現實驗證的科學洞見。

  • 自己做基因組研究,贏了《Science》上的成果:給它一周多時間,基本無人看管,它自己整理了 138 個物種、數百萬個細胞的資料,自己設計並訓練了一個機器學習模型,用來識別 "在不同物種裡扮演同一角色的細胞"。最後它訓出來的模型,效果超過了一篇發表在《Science》上的成果 —— 而體積還小了 100 倍。一個被高人指點了幾句的實習生干贏了頂級期刊。

  • 全世界最強的網路安全能力:官方直說它是當今地球上網路安全能力最強的模型 —— 能發現並利用幾乎所有主流系統的漏洞。這正是它當初被關進籠子的原因: 同一身本事,給防守方是銅牆鐵壁,給進攻方就是開鎖神器。

看明白這一段,你就懂了那層安全口罩為什麼必須存在。_一個能設計藥物的 AI,反過來也可能被用來設計危險的東西;一個能修補漏洞的 AI,反過來也能被用來攻破系統。_它強到能救命,也就強到能傷人。

所以 Anthropic 的選擇是: 把這身本事拆成兩份 —— 給大眾的 Fable,把最危險的幾扇門焊死; 給可信者的 Mythos,在嚴格監管下才放開。這不是小氣,是不得已。

那層口罩會不會天天誤傷我?多少錢?啥時輪到我?

先把安全口罩怎麼幹活講清楚,因為很多人一聽 "安全限制" 就腦補成 "動不動拒絕你"。其實這次的設計聰明得多。Fable 門口站著幾個 "安檢" (官方叫_分類器_),它們只盯三類高危話題 —— 網路攻擊、生物化學、模型蒸餾(指偷偷把模型能力 "抄" 去訓練別的模型)。一旦你的問題踩到這三條線,它不會把門一摔,而是 悄悄把這道題轉給二把手 Opus 4.8 來回答。比如有人問 "怎麼製造蓖麻毒素" 這種東西,Fable 自己閉嘴,Opus 4.8 給個安全的回應,系統也會明確告訴你 "剛才這題被轉接了"。為什麼不直接拒絕? 因為轉給一個稍弱但夠用的模型,體驗總比甩你一句無法回答強。

那會不會動不動就誤傷普通人? 會,但極少。官方說得很坦白: 這層口罩是 "寧可誤殺也不放過" 的保守調法,所以不到 5%的對話會被轉接,反過來說,95% 以上 的時候,你用到的就是滿血能力 (跟 Mythos 5 沒差別)。也就是說,你日常寫程式、做表格、讀文件、寫文案,基本一輩子都碰不到那道閘門。**真會反覆撞上的,是做安全研究、生物資訊這類專業活兒的人。**順帶提一句安全成色: 官方做了 超 1000 小時 的外部懸賞測試,沒有人能找到 "通用越獄"; 即使用上 30 種公開的破解套路,它對策劃網路攻擊這類請求,一次都沒鬆過口

講完講究,說最實在的 —— 錢和時間。Fable 5 和 Mythos 5 同價: 輸入 $10 / 百萬 token、輸出 $50 / 百萬 token。token 是啥: 粗略理解成 "把文字切成的小塊",按塊計費。這個價大約是 Opus 的兩倍,但只有當初 Mythos Preview 的不到一半 —— 等於更強了,還更便宜了。開發者今天就能用,API 裡的名字是 claude-fable-5

為啥這麼折騰? 官方反覆念叨一個詞: 產能(capacity)。意思是這模型太能耗算力,他們怕一開放需求直接爆掉,只能先免費讓大家嚐鮮、再階段性收緊、等擴容了再徹底放開。至於 Mythos 5(放開版),普通人買不到 —— 它只給 Glasswing 的網路安全夥伴 (還要配合美國政府),接下來會給一小批生物科研機構。想進靠的是 "資格審核",不是你有多少錢。還有個容易忽略但重要的細節: 所有 Mythos 級的企業流量,對話要留存 30 天用於安全監控(不拿去訓練模型)。

這對你我到底意味著啥?順便留三個清醒的問號

把前面七段收口,落到最實在的 "那我該幹啥"。

普通人別被術語嚇住,你要做的特別簡單 —— 趁 6 月 22 日前,去你的 Claude 訂閱裡把 Fable 5 選出來,拿你手頭一件真活試一把: 寫一份複雜的報告、改一段程式碼、把一摞 PDF 丟給它做分析、或者干脆把你腦子裡那個 "一直想做但不會做" 的小工具描述給它。你會親身體會到那個分水嶺 —— "把一整件事交給它" 和 "讓它幫個小忙",完全是兩種感覺。這一下,勝過看十篇測評。

做產品、創業的人機會有兩類。一是 "長任務" —— 以前你不敢交給 AI 的、要連續幹幾天、中途無數岔路的複雜活,現在該重新評估了,因為它真能扛下來。二是那被誤傷的 5% —— 如果你做的是安全、生物資訊這類正經專業方向,誰能拿到 Mythos 5 的可信訪問資格,誰就握住了一段別人摸不到的能力差,而能力差就是利潤。

看投資的人把估值模型裡 "模型多強" 的權重往下調一點,把 "能不能安全、規模化地把它部署出去" 往上提一點 —— 能力在變便宜,而 "馴服能力、敢放給公眾" 的本事,正在變成真正的護城河。

但一個成熟的讀者,得同時看見硬幣的另一面。這裡留三個清醒的問號。

**其一,"六十天悖論"。**兩個月前還說太危險不能公開,今天就端上桌 —— 變的不是模型的危險性,是護欄的工程進度。這提醒我們,所謂安全是個不斷打補丁的過程,不是一勞永逸的保證。

**其二,"一邊喊刹車,一邊踩油門"。**就在發布前不久,Anthropic 還公開呼籲各大公司給前沿 AI 研發裝個共同的刹車,警告系統可能快要能自己改進自己;轉頭就放出了史上最強的公開模型。這姿態是真矛盾,還是商業與安全的微妙平衡,見仁見智。

其三,"這是安全,還是權力集中?" 最強的"放開版"只給政府和大機構 (有報導稱美國國安局正準備把 Mythos 用於網路行動),而廣大普通防禦者卻用不到頂級網安能力 —— 再加上那條 30 天資料留存,有人就質疑這套安全敘事,會不會其實是把最強的力量,悄悄圈進了少數人手裡?

看懂一個王炸產品的成熟標誌,是你能同時為它的強大而興奮,又對它的代價保持清醒。

窗外 California Avenue 終於熱鬧起來,幾個穿連帽衫的工程師端著冰美式往 office 走,大概率,他們今天的第一件事,就是把 Fable 5 接進自己手頭的活兒裡。那只奶油色背景上的蝴蝶「5」還停在我手機螢幕上。

記住今天這個日子吧,這是能自己動手幹完整件事的前沿 AI,第一次摘下大半張面紗,公開走到我們面前。**一個版本戴著口罩交給你我,一個版本摘了口罩留給少數人。你站在哪一層,不只看錢包,更看資格。**而我們這代人,正好坐在這道分界線被畫下來的那一刻。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆