📢 Gate 广场 | Polymarket 6/4 特别预测:NBA 总决赛,尼克斯 vs 马刺谁能夺冠?
NBA 总决赛火热开打!目前 Polymarket 预测市场上,66% 用户押注马刺,35% 用户看好尼克斯。强强对决,您认为冠军最终花落谁家?
🎁 全民瓜分奖: 参与尼克斯 vs 马刺焦点战预测,瓜分 20,000 USDT 巨额奖池!
👉️ https://www.gate.com/zh/campaigns/5030
🎁 广场专属福利: 抽取 10 位发布优质内容的用户,每人赠送 $5 代币!
📝 参与攻略:
带 #预测NBA总冠军赢20,000U 发帖,选择以下任一方式参与:
🔹 方法 A:预测您心中的夺冠球队,并挂载事件卡片
🔹 方法 B:晒出您的交易截图,分享交易思路与观点
📍注意:选择方法 A 时,需在发帖页-币种图标中挂载对应 Polymarket 事件卡片,才算有效参与。
立即参与:https://gate.onelink.me/Hls0/prediction?page=detail&event_ticker=543443&source=cex
Claude有80%的程式碼是自己寫的,Anthropic呼籲「全球设计煞车机制」玩真的?
Anthropic 研究院 6 月 4 日发布「When AI Builds Itself」长文,揭露 Claude 已撰寫自家超过 80% 的合併程式碼,AI 可獨立處理长达 12 小时的软體任務,工程師生产力较 2024 年提升 8 倍,並正式呼籲全球建立「可验证的放緩或暫停」机制。
(前情提要:Anthropic发布Mythos之时,会是DeFi的核爆时刻嗎?)
(背景補充:10年恩怨:如果OpenAI不曾虛偽,就沒有Anthropic的強大)
本文目錄
Toggle
重点摘要
六月四日,Anthropic 研究院发布一篇五千字长文《When AI Builds Itself》。开门见山丟出一个數字,截至 2026 年 5 月,Claude 撰寫了 Anthropic 产品程式碼庫中超过 80% 的合併程式碼。在 2025 年初 Claude Code 上線之前,这个比例是个位數。
然后文章裡面同时呼籲「我們认为,世界最好能有一个选項,在需要时放緩或暫时暫停前沿 AI 开发。」
AI正在自我进化
Anthropic 在文章中说明了 Claude 自己升級的能力曲線。
2024 年 3 月,Claude Opus 3 能獨立處理一个需要人類约四分鐘完成的软體任務。
2025 年 3 月,Claude Sonnet 3.7 把这个數字推到了九十分鐘。
2026 年 3 月,Claude Opus 4.6 做到了十二小时。
这不是線性增长,任務时长的倍增週期从七个月壓縮到四个月。
Anthropic 在內部对 130 名研究團队員工做了一份调查,请他們估算使用 Mythos Preview 帶来的生产力倍數,中位數是四倍。
而从工程端量化的話,平均每位工程師每季合併的程式碼行數,从 2024 年第二季到 2026 年第二季增加了八倍。程式碼产出在 2021 至 2024 年间幾乎持平,然后在 2025 年开始陡升。
2026 年 4 月,Claude 獨立完成超过 800 項 API 错誤修復,將某一類错誤的发生率降低了一千倍。一位工程師估算,同樣的工作量如果交給人類,需要四年。
研究端的數字同樣驚人,两名人類研究員要花一週时间,在一个 AI 安全问題上恢復了 23% 的效能差距。Claude 代理群花了 800 个累计小时,用了约 18,000 美元的算力,恢復了 97%。
截至 2026 年 5 月,Claude 生成的程式碼品质已与人類工程師持平。Anthropic 的原話是「2025 年底时 Claude 寫的程式碼还比人差,现在打平,预计一年內嚴格優於人類。」
上次喊停的是 2019 年的 GPT-2
2019 年 2 月,OpenAI 发布 GPT-2 时宣布「太危险了,不完整公开」。那个模型有 15 亿引數,能寫出一半通順的英文段落。
七年后的今天,那个被认为太危险的模型,大约等於一部免费手机 App 的基礎功能。
每一次前沿实验室喊停或喊危险,事后都证明了两件事,第一个是危险是真的。第二个是喊停的人不会真的停。
OpenAI 在 GPT-2 发布后九个月发布了完整模型。Google 在 2023 年宣布 AI 需要「负责任的暫停」后,不到一年推出了 Gemini Ultra。
但 Anthropic 这次給了一个具體數字,共同創辦人 Jack Clark 表示,他认为 AI 达成递迴自我改进的机率,在 2028 年底前是 60%。
IPO之后的良心?
批評者沒有在客气的,Bentley 大学數学教授 Noah Giansiracusa 对 Scientific American 说:「我不认为这是 Anthropic 真心要放慢速度。」他指出 Dario Amodei 的实际立场是全速前进,因为「暫停在现实中根本不可能執行,零机率。」
而且模型已经在「自我进化」了,还停止什麼?
喬治亞理工学院教授 Mark Riedl 在社群上说得更直接,大型 AI 公司全都跳上了「递迴自我改进」的炒作列车。
更尖锐的解读是,如果 Anthropic 呼籲全球暫停前沿 AI 开发,如果真的成功了,凍結的是 Anthropic 已经處於领先地位的競爭格局。这要嘛是上市公司突然发了大善心,要嘛是精準的公关操作,我們知道前者机率不高。
更快的錘子,不会自己決定釘什麼
紐约大学教授 Gary Marcus 是最不留情面的批評者之一。他在 Substack 发文说,Anthropic 发表这篇文章做了一次「偷換概念」(bait and switch),把两个截然不同的东西混在一起講。
第一个是 AGI(通用人工智慧),假设 AI 能自主完成人類能做的一切。第二个是目前的现实,AI 作为一个非常快又好的編碼工具,让人類工程師的产出倍增。
Marcus 的論点是,Anthropic 展示的资料全部是第二種。Claude 確实寫了 80% 的程式碼,但那 80% 是在人類设定目標、指定方向、審查結果的框架下完成的。它是一把極快的錘子,但錘子不会自己決定要釘哪根釘子。
这个批評有道理嗎?部分有。Anthropic 自己的资料也佐证了 Marcus 的觀点:Claude 在「选擇下一步研究方向」的正確率,从 2025 年 11 月的 51% 提升到 2026 年 4 月的 64%。有进步,但 64% 意味著每三次有超过一次选错方向。
真正的递迴自我改进需要的不是更快地寫程式碼,而是更好地決定「寫什麼程式碼」。前者 Claude 已经做得比多數人類好。后者是人類目前仍具有「比较優勢」的地方。
Anthropic 一位匿名員工表示:「人類现在的比较優勢是看到更大的圖景,思考超越当前任務範圍的事情。」
人類的優勢不知道能維持多久。
Anthropic 自己不信那个情況会发生
文章列出三種未来。
情境一:趨勢停滯。AI 能力遇到瓶頸,可能是能源、算力、晶片製造的供应链限制。Anthropic 的評语:「我們认为这不太可能。」
情境二:複合效率持续增长。AI 开发大幅自动化,但人類仍指導研究方向。100 人的公司做到一万到十万人組织的工作。人類程式碼審查成为新的瓶頸。Anthropic 认为「我們可能正走向这个情境」。
情境三:完全的递迴自我改进。AI 自主设计並訓練自己的下一代,进展速度完全由算力決定。人類转为監督、验证、治理角色。
Anthropic 对第三種情境的风险描述值得逐字读:「今天模型中偶爾出现的对齐偏差,在递迴自我改进的環境中可能變得更频繁,同时更难被理解。」
我們理解这件話,可能接近现在的 AI 偶爾会做出不符合人類意圖的行为,但我們看得到。当 AI 自己改进自己时,这種偏差会多次複合,而我們会越来越难弄懂,它走偏到哪裡去了。
这可能是 AI 自我改进中真正重要的一句話,「更频繁,同时更难被理解」,AI 会走向对人類而言的邪惡嗎?
核武條约在 AI 时代行不通
Anthropic 提出的解法是一个「可验证的全球放緩机制」,參考物件是冷戰时期的中程核武條约(INF Treaty)。
这个類比本身就说明瞭问題的規模,INF 條约从开始談判到簽署花了將近十年。它只涉及两个国家。它可以透过衛星偵測飞彈发射井来验证。
訓練 AI 模型不是飞彈发射井,只要一个辦公空间就能完成,而算力设施可以是远距的,幾乎无法发现。
Anthropic 加了一个关鍵條件:「我們预期在其他處於前沿的开发者也以可验证方式做到时,我們会放緩或暫时暫停。」
Anthropic 的意思是,如果所有人都停,我們会停。如果有人不停,我們也不停。这是博弈論,在 AI 开发的博弈中,目前的納許均衡是所有人都继续跑,因为沒有人相信別人会停。
资本的本能是流动,沒有资本会暫停的。
常见问題
什麼是递迴自我改进(Recursive Self-Improvement)?
指 AI 系统能完全自主设计並开发下一代版本。Anthropic 资料顯示 Claude 已撰寫自身 80% 程式碼,但目前仍需人類指導研究方向与審查結果,尚未达完全自主改进,Jack Clark 給出 2028 年底前 60% 达成机率。
Anthropic 呼籲暫停 AI 开发的动机是什麼?
Anthropic 提议建立類似冷戰核武條约的「可验证放緩机制」,但前提是其他前沿实验室也配合。批評者指出此呼籲与 9,650 亿美元 IPO 申请僅隔三天,质疑凍結競爭格局的戰略意圖大於安全考量。