安全专家:与 Claude Mythos 同样危险的 AI 模型根本挡不住,24 个月内将遍地都是

川普政府上週以國安為由,強制要求 Anthropic 下架 Claude Fable 5 與 Mythos 5 兩款最強模型,理由是「可以越獄」。不過資安專家潑冷水,稱這次的管制只是一家公司、一批模型;6 到 24 個月內,同等能力將從多個來源廣泛流通。
(前情提要:燒錢買成長!OpenAI 外洩檔案揭「營運大虧 209 億美元」,預期 2030 年才能獲利)
(背景補充:CZ 大讚 Hyperliquid 是超棒發明!但笑稱無 KYC 太危險:我經歷過,他們最好有超強律師)

上週末,川普政府以國安風險為由,強制下架 Anthropic 旗下兩款最新模型:Claude Fable 5 與 Mythos 5。白宮的邏輯是:Fable 5 面向公眾開放,但它的護欄(簡單來說就是模型拒絕回應有害問題的安全機制)可以被解除,這被認定構成國安風險。

Anthropic 至今仍在與白宮協商重新上線條件,目前尚不清楚何時會重新上線。

這把雙刃劍,Anthropic 自己也知道

Mythos 5 不是普通的語言模型。自 Anthropic 在 4 月以「Mythos Preview」名義首次發布以來,公司就同步警告它的風險。簡單來說就是,在資安研究員手裡是防禦工具,在惡意行為者手裡可能是攻擊武器。

正因為如此,Mythos 5 最初只私下發布給 Project Glasswing 工作小組的精選聯盟;而 Fable 5 雖然對一般大眾公開,但在生物與資安等問題上設有特定封鎖。

6 個月 vs 24 個月

儘管川普政府下令封鎖,但 Anthropic 的前沿紅隊負責人 Logan Graham,早在 4 月 Mythos Preview 發表時就向《WIRED》說得很清楚:

「真正的訊息是,這不是關於這個模型或 Anthropic。我們必須現在就為一個世界做準備,6、12、24 個月內,這些能力會廣泛可得。」

資安顧問公司 TPO Group 資安長 Tarah Wheeler 說得更直接:

「認為沒有其他競爭者會發展出與 Mythos 類似能力、甚至認為他們還沒做到,是極度短視。有其他公司緊追 Anthropic 在後,很可能也具備這些能力,只是按兵不動,觀望 Anthropic 在當前監管環境下會被怎麼對待。」

哈佛大學研究者 Bruce Schneier 也向《WIRED》指出:「這是技術的整體趨勢。更小、更便宜、開源的模型,有時單獨、有時彼此協作,透過更精巧的提示就能匹配 Mythos 的表現。我們應該預期其他模型在數月內就能匹配 Mythos/Fable 的創造力與韌性,開源模型再稍久一點。」

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论