Claude有80%的程式碼是自己寫的,Anthropic呼籲「全球设计煞车机制」玩真的?

Anthropic 研究院 6 月 4 日发布「When AI Builds Itself」长文,揭露 Claude 已撰寫自家超过 80% 的合併程式碼,AI 可獨立處理长达 12 小时的软體任務,工程師生产力较 2024 年提升 8 倍,並正式呼籲全球建立「可验证的放緩或暫停」机制。
(前情提要:Anthropic发布Mythos之时,会是DeFi的核爆时刻嗎?)
(背景補充:10年恩怨:如果OpenAI不曾虛偽,就沒有Anthropic的強大)

本文目錄

Toggle

  • AI正在自我进化
  • 上次喊停的是 2019 年的 GPT-2
  • IPO之后的良心?
  • 更快的錘子,不会自己決定釘什麼
  • Anthropic 自己不信那个情況会发生
  • 核武條约在 AI 时代行不通

重点摘要

  • Claude 撰寫 Anthropic 超过 80% 合併程式碼,工程師每季产出较 2024 年提升 8 倍
  • AI 可獨立處理任務时长从 4 分鐘(2024/3)增至 12 小时(2026/3),倍增週期縮至 4 个月
  • Anthropic 6/1 以 9,650 亿美元估值递交 IPO,6/4 呼籲建立全球 AI 暫停机制

六月四日,Anthropic 研究院发布一篇五千字长文《When AI Builds Itself》。开门见山丟出一个數字,截至 2026 年 5 月,Claude 撰寫了 Anthropic 产品程式碼庫中超过 80% 的合併程式碼。在 2025 年初 Claude Code 上線之前,这个比例是个位數。

然后文章裡面同时呼籲「我們认为,世界最好能有一个选項,在需要时放緩或暫时暫停前沿 AI 开发。

AI正在自我进化

Anthropic 在文章中说明了 Claude 自己升級的能力曲線。

2024 年 3 月,Claude Opus 3 能獨立處理一个需要人類约四分鐘完成的软體任務。

2025 年 3 月,Claude Sonnet 3.7 把这个數字推到了九十分鐘。

2026 年 3 月,Claude Opus 4.6 做到了十二小时。

这不是線性增长,任務时长的倍增週期从七个月壓縮到四个月。

Anthropic 在內部对 130 名研究團队員工做了一份调查,请他們估算使用 Mythos Preview 帶来的生产力倍數,中位數是四倍。

而从工程端量化的話,平均每位工程師每季合併的程式碼行數,从 2024 年第二季到 2026 年第二季增加了八倍。程式碼产出在 2021 至 2024 年间幾乎持平,然后在 2025 年开始陡升。

2026 年 4 月,Claude 獨立完成超过 800 項 API 错誤修復,將某一類错誤的发生率降低了一千倍。一位工程師估算,同樣的工作量如果交給人類,需要四年。

研究端的數字同樣驚人,两名人類研究員要花一週时间,在一个 AI 安全问題上恢復了 23% 的效能差距。Claude 代理群花了 800 个累计小时,用了约 18,000 美元的算力,恢復了 97%。

截至 2026 年 5 月,Claude 生成的程式碼品质已与人類工程師持平。Anthropic 的原話是「2025 年底时 Claude 寫的程式碼还比人差,现在打平,预计一年內嚴格優於人類。」

上次喊停的是 2019 年的 GPT-2

2019 年 2 月,OpenAI 发布 GPT-2 时宣布「太危险了,不完整公开」。那个模型有 15 亿引數,能寫出一半通順的英文段落。

七年后的今天,那个被认为太危险的模型,大约等於一部免费手机 App 的基礎功能。

每一次前沿实验室喊停或喊危险,事后都证明了两件事,第一个是危险是真的。第二个是喊停的人不会真的停。

OpenAI 在 GPT-2 发布后九个月发布了完整模型。Google 在 2023 年宣布 AI 需要「负责任的暫停」后,不到一年推出了 Gemini Ultra。

但 Anthropic 这次給了一个具體數字,共同創辦人 Jack Clark 表示,他认为 AI 达成递迴自我改进的机率,在 2028 年底前是 60%。

IPO之后的良心?

批評者沒有在客气的,Bentley 大学數学教授 Noah Giansiracusa 对 Scientific American 说:「我不认为这是 Anthropic 真心要放慢速度。」他指出 Dario Amodei 的实际立场是全速前进,因为「暫停在现实中根本不可能執行,零机率。」

而且模型已经在「自我进化」了,还停止什麼?

喬治亞理工学院教授 Mark Riedl 在社群上说得更直接,大型 AI 公司全都跳上了「递迴自我改进」的炒作列车。

更尖锐的解读是,如果 Anthropic 呼籲全球暫停前沿 AI 开发,如果真的成功了,凍結的是 Anthropic 已经處於领先地位的競爭格局。这要嘛是上市公司突然发了大善心,要嘛是精準的公关操作,我們知道前者机率不高。

更快的錘子,不会自己決定釘什麼

紐约大学教授 Gary Marcus 是最不留情面的批評者之一。他在 Substack 发文说,Anthropic 发表这篇文章做了一次「偷換概念」(bait and switch),把两个截然不同的东西混在一起講。

第一个是 AGI(通用人工智慧),假设 AI 能自主完成人類能做的一切。第二个是目前的现实,AI 作为一个非常快又好的編碼工具,让人類工程師的产出倍增。

Marcus 的論点是,Anthropic 展示的资料全部是第二種。Claude 確实寫了 80% 的程式碼,但那 80% 是在人類设定目標、指定方向、審查結果的框架下完成的。它是一把極快的錘子,但錘子不会自己決定要釘哪根釘子。

一个更快的編碼工具大概不会毀滅世界。

这个批評有道理嗎?部分有。Anthropic 自己的资料也佐证了 Marcus 的觀点:Claude 在「选擇下一步研究方向」的正確率,从 2025 年 11 月的 51% 提升到 2026 年 4 月的 64%。有进步,但 64% 意味著每三次有超过一次选错方向。

真正的递迴自我改进需要的不是更快地寫程式碼,而是更好地決定「寫什麼程式碼」。前者 Claude 已经做得比多數人類好。后者是人類目前仍具有「比较優勢」的地方。

Anthropic 一位匿名員工表示:「人類现在的比较優勢是看到更大的圖景,思考超越当前任務範圍的事情。」

人類的優勢不知道能維持多久。

Anthropic 自己不信那个情況会发生

文章列出三種未来。

情境一:趨勢停滯。AI 能力遇到瓶頸,可能是能源、算力、晶片製造的供应链限制。Anthropic 的評语:「我們认为这不太可能。」

情境二:複合效率持续增长。AI 开发大幅自动化,但人類仍指導研究方向。100 人的公司做到一万到十万人組织的工作。人類程式碼審查成为新的瓶頸。Anthropic 认为「我們可能正走向这个情境」。

情境三:完全的递迴自我改进。AI 自主设计並訓練自己的下一代,进展速度完全由算力決定。人類转为監督、验证、治理角色。

Anthropic 对第三種情境的风险描述值得逐字读:「今天模型中偶爾出现的对齐偏差,在递迴自我改进的環境中可能變得更频繁,同时更难被理解。」

我們理解这件話,可能接近现在的 AI 偶爾会做出不符合人類意圖的行为,但我們看得到。当 AI 自己改进自己时,这種偏差会多次複合,而我們会越来越难弄懂,它走偏到哪裡去了。

这可能是 AI 自我改进中真正重要的一句話,「更频繁,同时更难被理解」,AI 会走向对人類而言的邪惡嗎?

核武條约在 AI 时代行不通

Anthropic 提出的解法是一个「可验证的全球放緩机制」,參考物件是冷戰时期的中程核武條约(INF Treaty)。

这个類比本身就说明瞭问題的規模,INF 條约从开始談判到簽署花了將近十年。它只涉及两个国家。它可以透过衛星偵測飞彈发射井来验证。

訓練 AI 模型不是飞彈发射井,只要一个辦公空间就能完成,而算力设施可以是远距的,幾乎无法发现。

Anthropic 加了一个关鍵條件:「我們预期在其他處於前沿的开发者也以可验证方式做到时,我們会放緩或暫时暫停。」

Anthropic 的意思是,如果所有人都停,我們会停。如果有人不停,我們也不停。这是博弈論,在 AI 开发的博弈中,目前的納許均衡是所有人都继续跑,因为沒有人相信別人会停。

资本的本能是流动,沒有资本会暫停的。

常见问題

什麼是递迴自我改进(Recursive Self-Improvement)?

指 AI 系统能完全自主设计並开发下一代版本。Anthropic 资料顯示 Claude 已撰寫自身 80% 程式碼,但目前仍需人類指導研究方向与審查結果,尚未达完全自主改进,Jack Clark 給出 2028 年底前 60% 达成机率。

Anthropic 呼籲暫停 AI 开发的动机是什麼?

Anthropic 提议建立類似冷戰核武條约的「可验证放緩机制」,但前提是其他前沿实验室也配合。批評者指出此呼籲与 9,650 亿美元 IPO 申请僅隔三天,质疑凍結競爭格局的戰略意圖大於安全考量。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论