アントロピック研究所は6月4日に「When AI Builds Itself」という長文を公開し、Claudeが自社の80%以上のマージコードを執筆していることを明らかにした。AIは最大12時間のソフトウェアタスクを独立して処理できるようになり、エンジニアの生産性は2024年比で8倍向上している。さらに、世界的に「検証可能な緩和または一時停止」メカニズムの構築を正式に呼びかけている。 (前提情報:アントロピックがMythosをリリースした時、DeFiの核爆発の時期になるのか?) (背景補足:10年の恩讐:OpenAIが虚偽をしなければ、アントロピックの強さはなかった)
本文目次
Toggle
ポイント要約
6月4日、アントロピック研究所は5000字の長文「When AI Builds Itself」を公開した。冒頭で示された数字は、2026年5月までにClaudeがアントロピックの製品コードベースの80%以上のマージコードを執筆したことだ。2025年初頭にClaude Codeが稼働する前は、この割合は一桁だった。
そして、記事内では「我々は、必要に応じて最先端のAI開発を緩めたり一時停止したりする選択肢が世界にあった方が良いと考えている」と呼びかけている。
アントロピックは、Claudeの自己アップグレード能力の曲線を説明している。
2024年3月、Claude Opus 3は人間が約4分で完了するソフトウェアタスクを独立して処理できた。
2025年3月、Claude Sonnet 3.7はこの時間を90分にまで伸ばした。
2026年3月、Claude Opus 4.6は12時間を達成した。
これは線形の成長ではなく、タスク処理時間の倍増サイクルが7ヶ月から4ヶ月に短縮されたことを意味する。
アントロピックは内部調査として、130名の研究チームメンバーにMythos Previewによる生産性の倍増を推定させたところ、中位数は4倍だった。
また、エンジニアリング側の定量的データでは、2024年第2四半期から2026年第2四半期までに、平均的なエンジニアのマージコード行数は8倍に増加した。コード出力は2021年から2024年までほぼ横ばいだったが、2025年から急激に増加し始めた。
2026年4月、Claudeは800以上のAPIエラー修正を独立して完了し、あるタイプのエラー発生率を1000分の1にまで低減させた。あるエンジニアは、同じ作業を人間に任せると4年かかると推定している。
研究側の数字も驚異的で、2人の人間研究員が1週間かけてAIの安全性問題に取り組み、23%のパフォーマンスギャップを回復した。Claudeの代理群は合計800時間をかけ、約1万8000ドルの計算資源を使って97%を回復した。
2026年5月時点で、Claudeが生成したコードの品質は人間のエンジニアと同等になった。アントロピックの公式見解は、「2025年末にはClaudeのコードは人間より劣っていたが、現在は同等であり、1年以内に厳密に人間を上回る見込みだ」と述べている。
2019年2月、OpenAIはGPT-2をリリースした際、「危険すぎるため完全公開は見合わせる」と発表した。このモデルは15億のパラメータを持ち、英語の段落の半分を通じて書くことができた。
7年後の今日、その当時危険とされたモデルは、ほぼ無料のスマホアプリの基本機能に相当する。
最先端の実験室が停止や危険を叫ぶたびに、二つの事実が証明されている。一つは、その危険性が本物であること。もう一つは、停止を叫ぶ者たちが実際に止めることはないということだ。
OpenAIはGPT-2の公開から9ヶ月後に完全モデルを公開した。Googleは2023年にAIには「責任ある一時停止」が必要だと発表し、1年も経たずにGemini Ultraをリリースした。
しかし、アントロピックは今回、具体的な数字を示した。共同創設者のジャック・クラークは、AIが自己改良を繰り返す確率は2028年末までに60%と考えている。
批評家は遠慮なく意見を述べている。ベントレー大学の数学教授ノア・ジアンシラクーザは、Scientific Americanに対し、「私はこれがアントロピックの本気の速度緩和意志だとは思わない」と述べた。彼は、ダリオ・アモデイの立場は全速前進であり、「現実的には一時停止は不可能であり、ゼロの確率だ」と指摘している。
さらに、モデルはすでに「自己進化」しているのに、何を停止する必要があるのか?
ジョージア工科大学のマーク・リードル教授は、より直接的に語った。大規模AI企業は皆、「自己改良」の煽りに乗っている。
より鋭い解釈は、もしアントロピックが世界的な最先端AI開発の一時停止を呼びかけ、それが成功した場合、すでにリードしているアントロピックの競争状況が凍結されることになる。これは、上場企業が突然善意を示すか、戦略的なPR操作のいずれかだろう。前者の確率は低いと我々は考える。
ニューヨーク大学のゲイリー・マーカス教授は、最も辛辣な批評者の一人だ。彼はSubstackにて、「アントロピックのこの文章は『概念のすり替え』(bait and switch)を行っており、二つの全く異なるものを混同している」と指摘している。
一つはAGI(汎用人工知能)であり、AIが人間のすべてを自主的に完遂できると仮定するもの。もう一つは現実であり、AIは非常に高速かつ優れたコーディングツールとして、人間のエンジニアの生産性を倍増させるだけだ。
マーカスの論点は、アントロピックが示すデータはすべて後者の範囲内だということだ。Claudeは確かに80%のコードを書いたが、その80%は人間が目標設定や方向指示、結果の審査の枠組みの中で行われたものである。これは非常に高速なハンマーだが、釘を自分で決めて打つことはできない。
より速いコーディングツールは世界を破壊しないだろう。
この批判は妥当だろうか?一部は正しい。アントロピックの資料もまた、マーカスの見解を裏付けている。Claudeの「次の研究方向の選択正確率」は、2025年11月の51%から2026年4月の64%に向上した。進歩はあるが、64%は三回に一回以上間違えることを意味する。
真の自己改良には、「何をコード化するか」をより良く決めることが必要だ。前者はClaudeはすでに多くの人間より優れている。後者は人間が今もなお「優位性」を持つ部分だ。
アントロピックの匿名社員は、「人類の今の優位性は、より大きな全体像を見通し、現在のタスク範囲を超えたことを考えることだ」と述べている。
人類の優位性がいつまで続くかは不明だ。
記事は三つの未来シナリオを示している。
シナリオ一:停滞。エネルギー、計算能力、半導体供給の制約により、AI能力が頭打ちになる可能性。アントロピックは「それはあまりあり得ない」と見ている。
シナリオ二:効率の継続的向上。AI開発は大きく自動化されるが、人間は研究方向を指導し続ける。100人規模の企業が1万人や10万人の組織の仕事をこなす。人間のコード審査が新たなボトルネックとなる。アントロピックは「我々はこのシナリオに向かっている可能性がある」と考えている。
シナリオ三:完全な自己改良。AIが自ら次世代を設計・訓練し、進展速度は計算資源のみに左右される。人類は監督・検証・ガバナンスの役割に移行。
アントロピックは、第三のシナリオのリスクについて次のように述べている。「今日のモデルに時折見られる整合性の偏りは、自己改良の環境下ではより頻繁に、そして理解しにくくなる可能性がある。」
この言葉を理解すれば、現在のAIが時折人間の意図に反した行動をとることと似ているが、我々には見えている。AIが自己改良を進めるとき、その偏りは何度も積み重なり、我々はその偏りの行き先をますます理解しにくくなる。
これは、AIの自己改良において本当に重要な一言、「より頻繁に、そして理解しにくくなる」が示す通り、AIは人類にとっての邪悪へと向かうのか?
アントロピックが提案する解決策は、「検証可能なグローバル緩和メカニズム」だ。冷戦時代の中距離核兵器条約(INF条約)を参考にしている。
この比喩は問題の規模を端的に示している。INF条約は交渉開始から締結まで約10年かかった。対象は二国間のみ。衛星監視によるミサイル発射井の検証が可能だった。
一方、AIモデルの訓練はミサイル発射井ではなく、オフィス空間一つで完結できる。計算資源は遠隔に設置され、ほぼ発見不可能だ。
アントロピックは重要な条件を付け加えている。「他の最先端開発者も検証可能な方法で行う場合に限り、我々は緩和または一時停止を検討する」と。
アントロピックの意図は、もし全員が停止すれば我々も停止するということだ。もし誰かが止めなければ、我々も止めない。これはゲーム理論の話であり、現在のAI開発におけるナッシュ均衡は、誰も止めずに皆走り続ける状態だ。誰も他者が止めるとは信じていないからだ。
資本の本能は流動性にあり、資本が停止することはほぼあり得ない。
よくある質問
遞迴自己改進(Recursive Self-Improvement)とは何か?
AIシステムが完全に自主的に次世代を設計・開発できる状態を指す。アントロピックの資料によると、Claudeは自身の80%のコードを書いたが、現状では研究方向や結果の審査には人間の指導が必要であり、完全な自主改良には至っていない。ジャック・クラークは2028年末までに60%の達成確率を示している。
アントロピックがAI開発の一時停止を呼びかける動機は何か?
冷戦時代の核兵器条約のような「検証可能な緩和メカニズム」の構築を提案しているが、前提として他の最先端研究者も協力する必要がある。批評家は、この呼びかけがアントロピックの96.5億ドルのIPO申請からわずか3日後に出されたことに疑問を呈し、競争の凍結よりも安全性よりも戦略的なPRの意図が強いと指摘している。
3.52M 人気度
2.18M 人気度
55.01K 人気度
657.53M 人気度
1.39M 人気度
Claudeは80%のコードを自分で書いている、Anthropicは「世界的な設計ブレーキメカニズム」を本気で呼びかけているのか?
アントロピック研究所は6月4日に「When AI Builds Itself」という長文を公開し、Claudeが自社の80%以上のマージコードを執筆していることを明らかにした。AIは最大12時間のソフトウェアタスクを独立して処理できるようになり、エンジニアの生産性は2024年比で8倍向上している。さらに、世界的に「検証可能な緩和または一時停止」メカニズムの構築を正式に呼びかけている。 (前提情報:アントロピックがMythosをリリースした時、DeFiの核爆発の時期になるのか?) (背景補足:10年の恩讐:OpenAIが虚偽をしなければ、アントロピックの強さはなかった)
本文目次
Toggle
ポイント要約
6月4日、アントロピック研究所は5000字の長文「When AI Builds Itself」を公開した。冒頭で示された数字は、2026年5月までにClaudeがアントロピックの製品コードベースの80%以上のマージコードを執筆したことだ。2025年初頭にClaude Codeが稼働する前は、この割合は一桁だった。
そして、記事内では「我々は、必要に応じて最先端のAI開発を緩めたり一時停止したりする選択肢が世界にあった方が良いと考えている」と呼びかけている。
AIが自己進化中
アントロピックは、Claudeの自己アップグレード能力の曲線を説明している。
2024年3月、Claude Opus 3は人間が約4分で完了するソフトウェアタスクを独立して処理できた。
2025年3月、Claude Sonnet 3.7はこの時間を90分にまで伸ばした。
2026年3月、Claude Opus 4.6は12時間を達成した。
これは線形の成長ではなく、タスク処理時間の倍増サイクルが7ヶ月から4ヶ月に短縮されたことを意味する。
アントロピックは内部調査として、130名の研究チームメンバーにMythos Previewによる生産性の倍増を推定させたところ、中位数は4倍だった。
また、エンジニアリング側の定量的データでは、2024年第2四半期から2026年第2四半期までに、平均的なエンジニアのマージコード行数は8倍に増加した。コード出力は2021年から2024年までほぼ横ばいだったが、2025年から急激に増加し始めた。
2026年4月、Claudeは800以上のAPIエラー修正を独立して完了し、あるタイプのエラー発生率を1000分の1にまで低減させた。あるエンジニアは、同じ作業を人間に任せると4年かかると推定している。
研究側の数字も驚異的で、2人の人間研究員が1週間かけてAIの安全性問題に取り組み、23%のパフォーマンスギャップを回復した。Claudeの代理群は合計800時間をかけ、約1万8000ドルの計算資源を使って97%を回復した。
2026年5月時点で、Claudeが生成したコードの品質は人間のエンジニアと同等になった。アントロピックの公式見解は、「2025年末にはClaudeのコードは人間より劣っていたが、現在は同等であり、1年以内に厳密に人間を上回る見込みだ」と述べている。
最初に停止を叫んだのは2019年のGPT-2
2019年2月、OpenAIはGPT-2をリリースした際、「危険すぎるため完全公開は見合わせる」と発表した。このモデルは15億のパラメータを持ち、英語の段落の半分を通じて書くことができた。
7年後の今日、その当時危険とされたモデルは、ほぼ無料のスマホアプリの基本機能に相当する。
最先端の実験室が停止や危険を叫ぶたびに、二つの事実が証明されている。一つは、その危険性が本物であること。もう一つは、停止を叫ぶ者たちが実際に止めることはないということだ。
OpenAIはGPT-2の公開から9ヶ月後に完全モデルを公開した。Googleは2023年にAIには「責任ある一時停止」が必要だと発表し、1年も経たずにGemini Ultraをリリースした。
しかし、アントロピックは今回、具体的な数字を示した。共同創設者のジャック・クラークは、AIが自己改良を繰り返す確率は2028年末までに60%と考えている。
IPO後の良心?
批評家は遠慮なく意見を述べている。ベントレー大学の数学教授ノア・ジアンシラクーザは、Scientific Americanに対し、「私はこれがアントロピックの本気の速度緩和意志だとは思わない」と述べた。彼は、ダリオ・アモデイの立場は全速前進であり、「現実的には一時停止は不可能であり、ゼロの確率だ」と指摘している。
さらに、モデルはすでに「自己進化」しているのに、何を停止する必要があるのか?
ジョージア工科大学のマーク・リードル教授は、より直接的に語った。大規模AI企業は皆、「自己改良」の煽りに乗っている。
より鋭い解釈は、もしアントロピックが世界的な最先端AI開発の一時停止を呼びかけ、それが成功した場合、すでにリードしているアントロピックの競争状況が凍結されることになる。これは、上場企業が突然善意を示すか、戦略的なPR操作のいずれかだろう。前者の確率は低いと我々は考える。
より速いハンマーは自分で釘を決められない
ニューヨーク大学のゲイリー・マーカス教授は、最も辛辣な批評者の一人だ。彼はSubstackにて、「アントロピックのこの文章は『概念のすり替え』(bait and switch)を行っており、二つの全く異なるものを混同している」と指摘している。
一つはAGI(汎用人工知能)であり、AIが人間のすべてを自主的に完遂できると仮定するもの。もう一つは現実であり、AIは非常に高速かつ優れたコーディングツールとして、人間のエンジニアの生産性を倍増させるだけだ。
マーカスの論点は、アントロピックが示すデータはすべて後者の範囲内だということだ。Claudeは確かに80%のコードを書いたが、その80%は人間が目標設定や方向指示、結果の審査の枠組みの中で行われたものである。これは非常に高速なハンマーだが、釘を自分で決めて打つことはできない。
この批判は妥当だろうか?一部は正しい。アントロピックの資料もまた、マーカスの見解を裏付けている。Claudeの「次の研究方向の選択正確率」は、2025年11月の51%から2026年4月の64%に向上した。進歩はあるが、64%は三回に一回以上間違えることを意味する。
真の自己改良には、「何をコード化するか」をより良く決めることが必要だ。前者はClaudeはすでに多くの人間より優れている。後者は人間が今もなお「優位性」を持つ部分だ。
アントロピックの匿名社員は、「人類の今の優位性は、より大きな全体像を見通し、現在のタスク範囲を超えたことを考えることだ」と述べている。
人類の優位性がいつまで続くかは不明だ。
アントロピック自身はその状況が起きるとは信じていない
記事は三つの未来シナリオを示している。
シナリオ一:停滞。エネルギー、計算能力、半導体供給の制約により、AI能力が頭打ちになる可能性。アントロピックは「それはあまりあり得ない」と見ている。
シナリオ二:効率の継続的向上。AI開発は大きく自動化されるが、人間は研究方向を指導し続ける。100人規模の企業が1万人や10万人の組織の仕事をこなす。人間のコード審査が新たなボトルネックとなる。アントロピックは「我々はこのシナリオに向かっている可能性がある」と考えている。
シナリオ三:完全な自己改良。AIが自ら次世代を設計・訓練し、進展速度は計算資源のみに左右される。人類は監督・検証・ガバナンスの役割に移行。
アントロピックは、第三のシナリオのリスクについて次のように述べている。「今日のモデルに時折見られる整合性の偏りは、自己改良の環境下ではより頻繁に、そして理解しにくくなる可能性がある。」
この言葉を理解すれば、現在のAIが時折人間の意図に反した行動をとることと似ているが、我々には見えている。AIが自己改良を進めるとき、その偏りは何度も積み重なり、我々はその偏りの行き先をますます理解しにくくなる。
これは、AIの自己改良において本当に重要な一言、「より頻繁に、そして理解しにくくなる」が示す通り、AIは人類にとっての邪悪へと向かうのか?
核兵器条約はAI時代には通用しない
アントロピックが提案する解決策は、「検証可能なグローバル緩和メカニズム」だ。冷戦時代の中距離核兵器条約(INF条約)を参考にしている。
この比喩は問題の規模を端的に示している。INF条約は交渉開始から締結まで約10年かかった。対象は二国間のみ。衛星監視によるミサイル発射井の検証が可能だった。
一方、AIモデルの訓練はミサイル発射井ではなく、オフィス空間一つで完結できる。計算資源は遠隔に設置され、ほぼ発見不可能だ。
アントロピックは重要な条件を付け加えている。「他の最先端開発者も検証可能な方法で行う場合に限り、我々は緩和または一時停止を検討する」と。
アントロピックの意図は、もし全員が停止すれば我々も停止するということだ。もし誰かが止めなければ、我々も止めない。これはゲーム理論の話であり、現在のAI開発におけるナッシュ均衡は、誰も止めずに皆走り続ける状態だ。誰も他者が止めるとは信じていないからだ。
資本の本能は流動性にあり、資本が停止することはほぼあり得ない。
よくある質問
遞迴自己改進(Recursive Self-Improvement)とは何か?
AIシステムが完全に自主的に次世代を設計・開発できる状態を指す。アントロピックの資料によると、Claudeは自身の80%のコードを書いたが、現状では研究方向や結果の審査には人間の指導が必要であり、完全な自主改良には至っていない。ジャック・クラークは2028年末までに60%の達成確率を示している。
アントロピックがAI開発の一時停止を呼びかける動機は何か?
冷戦時代の核兵器条約のような「検証可能な緩和メカニズム」の構築を提案しているが、前提として他の最先端研究者も協力する必要がある。批評家は、この呼びかけがアントロピックの96.5億ドルのIPO申請からわずか3日後に出されたことに疑問を呈し、競争の凍結よりも安全性よりも戦略的なPRの意図が強いと指摘している。