Claude有80%的程式碼是自己寫的，Anthropic呼籲「全球设计煞车机制」玩真的？

Question

Anthropic 研究院 6 月 4 日发布「When AI Builds Itself」长文，揭露 Claude 已撰寫自家超过 80% 的合併程式碼，AI 可獨立處理长达 12 小时的软體任務，工程師生产力较 2024 年提升 8 倍，並正式呼籲全球建立「可验证的放緩或暫停」机制。
（前情提要：Anthropic发布Mythos之时，会是DeFi的核爆时刻嗎？）
（背景補充：10年恩怨：如果OpenAI不曾虛偽，就沒有Anthropic的強大）

本文目錄

Toggle

AI正在自我进化
上次喊停的是 2019 年的 GPT-2
IPO之后的良心？
更快的錘子，不会自己決定釘什麼
Anthropic 自己不信那个情況会发生
核武條约在 AI 时代行不通

重点摘要

Claude 撰寫 Anthropic 超过 80% 合併程式碼，工程師每季产出较 2024 年提升 8 倍
AI 可獨立處理任務时长从 4 分鐘（2024/3）增至 12 小时（2026/3），倍增週期縮至 4 个月
Anthropic 6/1 以 9,650 亿美元估值递交 IPO，6/4 呼籲建立全球 AI 暫停机制

六月四日，Anthropic 研究院发布一篇五千字长文《When AI Builds Itself》。开门见山丟出一个數字，截至 2026 年 5 月，Claude 撰寫了 Anthropic 产品程式碼庫中超过 80% 的合併程式碼。在 2025 年初 Claude Code 上線之前，这个比例是个位數。

然后文章裡面同时呼籲「我們认为，世界最好能有一个选項，在需要时放緩或暫时暫停前沿 AI 开发。」

AI正在自我进化

Anthropic 在文章中说明了 Claude 自己升級的能力曲線。

2024 年 3 月，Claude Opus 3 能獨立處理一个需要人類约四分鐘完成的软體任務。

2025 年 3 月，Claude Sonnet 3.7 把这个數字推到了九十分鐘。

2026 年 3 月，Claude Opus 4.6 做到了十二小时。

这不是線性增长，任務时长的倍增週期从七个月壓縮到四个月。

Anthropic 在內部对 130 名研究團队員工做了一份调查，请他們估算使用 Mythos Preview 帶来的生产力倍數，中位數是四倍。

而从工程端量化的話，平均每位工程師每季合併的程式碼行數，从 2024 年第二季到 2026 年第二季增加了八倍。程式碼产出在 2021 至 2024 年间幾乎持平，然后在 2025 年开始陡升。

2026 年 4 月，Claude 獨立完成超过 800 項 API 错誤修復，將某一類错誤的发生率降低了一千倍。一位工程師估算，同樣的工作量如果交給人類，需要四年。

研究端的數字同樣驚人，两名人類研究員要花一週时间，在一个 AI 安全问題上恢復了 23% 的效能差距。Claude 代理群花了 800 个累计小时，用了约 18,000 美元的算力，恢復了 97%。

截至 2026 年 5 月，Claude 生成的程式碼品质已与人類工程師持平。Anthropic 的原話是「2025 年底时 Claude 寫的程式碼还比人差，现在打平，预计一年內嚴格優於人類。」

上次喊停的是 2019 年的 GPT-2

2019 年 2 月，OpenAI 发布 GPT-2 时宣布「太危险了，不完整公开」。那个模型有 15 亿引數，能寫出一半通順的英文段落。

七年后的今天，那个被认为太危险的模型，大约等於一部免费手机 App 的基礎功能。

每一次前沿实验室喊停或喊危险，事后都证明了两件事，第一个是危险是真的。第二个是喊停的人不会真的停。

OpenAI 在 GPT-2 发布后九个月发布了完整模型。Google 在 2023 年宣布 AI 需要「负责任的暫停」后，不到一年推出了 Gemini Ultra。

但 Anthropic 这次給了一个具體數字，共同創辦人 Jack Clark 表示，他认为 AI 达成递迴自我改进的机率，在 2028 年底前是 60%。

IPO之后的良心？

批評者沒有在客气的，Bentley 大学數学教授 Noah Giansiracusa 对 Scientific American 说：「我不认为这是 Anthropic 真心要放慢速度。」他指出 Dario Amodei 的实际立场是全速前进，因为「暫停在现实中根本不可能執行，零机率。」

而且模型已经在「自我进化」了，还停止什麼？

喬治亞理工学院教授 Mark Riedl 在社群上说得更直接，大型 AI 公司全都跳上了「递迴自我改进」的炒作列车。

更尖锐的解读是，如果 Anthropic 呼籲全球暫停前沿 AI 开发，如果真的成功了，凍結的是 Anthropic 已经處於领先地位的競爭格局。这要嘛是上市公司突然发了大善心，要嘛是精準的公关操作，我們知道前者机率不高。

更快的錘子，不会自己決定釘什麼

紐约大学教授 Gary Marcus 是最不留情面的批評者之一。他在 Substack 发文说，Anthropic 发表这篇文章做了一次「偷換概念」（bait and switch），把两个截然不同的东西混在一起講。

第一个是 AGI（通用人工智慧），假设 AI 能自主完成人類能做的一切。第二个是目前的现实，AI 作为一个非常快又好的編碼工具，让人類工程師的产出倍增。

Marcus 的論点是，Anthropic 展示的资料全部是第二種。Claude 確实寫了 80% 的程式碼，但那 80% 是在人類设定目標、指定方向、審查結果的框架下完成的。它是一把極快的錘子，但錘子不会自己決定要釘哪根釘子。

一个更快的編碼工具大概不会毀滅世界。

这个批評有道理嗎？部分有。Anthropic 自己的资料也佐证了 Marcus 的觀点：Claude 在「选擇下一步研究方向」的正確率，从 2025 年 11 月的 51% 提升到 2026 年 4 月的 64%。有进步，但 64% 意味著每三次有超过一次选错方向。

真正的递迴自我改进需要的不是更快地寫程式碼，而是更好地決定「寫什麼程式碼」。前者 Claude 已经做得比多數人類好。后者是人類目前仍具有「比较優勢」的地方。

Anthropic 一位匿名員工表示：「人類现在的比较優勢是看到更大的圖景，思考超越当前任務範圍的事情。」

人類的優勢不知道能維持多久。

Anthropic 自己不信那个情況会发生

文章列出三種未来。

情境一：趨勢停滯。AI 能力遇到瓶頸，可能是能源、算力、晶片製造的供应链限制。Anthropic 的評语：「我們认为这不太可能。」

情境二：複合效率持续增长。AI 开发大幅自动化，但人類仍指導研究方向。100 人的公司做到一万到十万人組织的工作。人類程式碼審查成为新的瓶頸。Anthropic 认为「我們可能正走向这个情境」。

情境三：完全的递迴自我改进。AI 自主设计並訓練自己的下一代，进展速度完全由算力決定。人類转为監督、验证、治理角色。

Anthropic 对第三種情境的风险描述值得逐字读：「今天模型中偶爾出现的对齐偏差，在递迴自我改进的環境中可能變得更频繁，同时更难被理解。」

我們理解这件話，可能接近现在的 AI 偶爾会做出不符合人類意圖的行为，但我們看得到。当 AI 自己改进自己时，这種偏差会多次複合，而我們会越来越难弄懂，它走偏到哪裡去了。

这可能是 AI 自我改进中真正重要的一句話，「更频繁，同时更难被理解」，AI 会走向对人類而言的邪惡嗎？

核武條约在 AI 时代行不通

Anthropic 提出的解法是一个「可验证的全球放緩机制」，參考物件是冷戰时期的中程核武條约（INF Treaty）。

这个類比本身就说明瞭问題的規模，INF 條约从开始談判到簽署花了將近十年。它只涉及两个国家。它可以透过衛星偵測飞彈发射井来验证。

訓練 AI 模型不是飞彈发射井，只要一个辦公空间就能完成，而算力设施可以是远距的，幾乎无法发现。

Anthropic 加了一个关鍵條件：「我們预期在其他處於前沿的开发者也以可验证方式做到时，我們会放緩或暫时暫停。」

Anthropic 的意思是，如果所有人都停，我們会停。如果有人不停，我們也不停。这是博弈論，在 AI 开发的博弈中，目前的納許均衡是所有人都继续跑，因为沒有人相信別人会停。

资本的本能是流动，沒有资本会暫停的。

常见问題

什麼是递迴自我改进（Recursive Self-Improvement）？

指 AI 系统能完全自主设计並开发下一代版本。Anthropic 资料顯示 Claude 已撰寫自身 80% 程式碼，但目前仍需人類指導研究方向与審查結果，尚未达完全自主改进，Jack Clark 給出 2028 年底前 60% 达成机率。

Anthropic 呼籲暫停 AI 开发的动机是什麼？

Anthropic 提议建立類似冷戰核武條约的「可验证放緩机制」，但前提是其他前沿实验室也配合。批評者指出此呼籲与 9,650 亿美元 IPO 申请僅隔三天，质疑凍結競爭格局的戰略意圖大於安全考量。

查看原文

Claude有80%的程式碼是自己寫的，Anthropic呼籲「全球设计煞车机制」玩真的？

AI正在自我进化

上次喊停的是 2019 年的 GPT-2

IPO之后的良心？

更快的錘子，不会自己決定釘什麼

Anthropic 自己不信那个情況会发生

核武條约在 AI 时代行不通

热门话题

分享美股交易赢英伟达股票

预测NBA总冠军赢20,000U

比特币ETF单日净流出7272枚

SpaceXIPO路演视频提及小行星采矿

成长值抽奖赢金条

置顶