Anthropic の三重の瞬間:コード漏洩、政府との対立、そして武器化

著者:Ben Thompson

翻訳:深潮 TechFlow

深潮ガイド:Anthropicの新モデルFableはリリースからわずか2か月で米国政府に緊急停止命令を受けた。一見「安全漏洩」が原因だが、実際にはAI研究所と政府、ソフトウェア業界との二重戦争を露呈している。この「安全」を売りにする企業は、安全の物語を商業的防御線に変え、彼らが本当に狙うのはマイクロソフトなどの手中のユーザーデータである。

私は嘲笑者の立場を理解している。彼らは常に、Anthropicの公開声明、特にモデルリリース時の説明はマーケティングのために恐怖を煽る狙いだと考えている。2か月前、AnthropicはMythos Previewを発表し、このモデルは危険すぎて公開できないと主張した。特に、その強力なネットワークセキュリティ能力を理由にしていた。そして今、2か月後に、Anthropicは安全柵を追加したMythosのバージョンであるFableを公開した。

私の限られた使用経験から言えば、Fableは確かに非常に優れたモデルだ。今やプログラミング性能以外は、モデルの客観的評価は難しいが、主観的には非常に良いと感じる。Fableとのインタラクションは極めて優れており、GPT 5.5やOpus 4.8を含む他のモデルよりも小さくて愚かに見える。以前はGPT-4とGrok 4の2回だけこの感覚を持ったことがある。これらはいずれも、基礎モデルの規模と複雑さの新世代を代表している。私はFableが新しい事前学習に由来し、新世代の最初のモデルだと考えている。

したがって、FableやMythosが安全性の認識と活用において確かにより強力であることは完全に理解できる。Anthropicが慎重にリリースしたのは理にかなっている。しかし、モデルを公開することの問題は、柵は脱獄可能であり、リリース後すぐにそのような事態が起きたことだ。

Anthropic、再び米国政府と対立

次に起きたことはやや不明瞭だ。Anthropicはブログ記事で次のように述べている。

米国政府は国家安全保障の権限を行使し、輸出規制命令を発し、Fable 5とMythos 5への外国人のアクセスを停止した。これは米国内外を問わず、Anthropicの外国籍社員も含む。この命令の実質的な効果は、我々が突然すべての顧客に対してFable 5とMythos 5を無効にし、コンプライアンスを確保しなければならなくなったことだ。他のAnthropicモデルへのアクセスには影響しない。

我々は今日、米東時間午後5時21分にこの命令を受け取った。具体的な国家安全保障上の懸念の詳細は示されていない。我々は、政府がFable 5を迂回または「脱獄」させる方法をすでに発見していると理解している。特定の技術を用いた少数の既知の脆弱性を識別するデモを検討したが、それらは比較的単純に見え、他の公開モデルもそれらを発見できることがわかった。

Anthropicは続けて、非汎用的な脱獄は避けられず範囲も限定的であり、汎用的な脱獄の証拠はないと論じている。見つかった脱獄はAmazonが報告したものであり、注目に値する。なぜなら、AmazonはAnthropicの投資者であり、同社の推論サービスの主要提供者だからだ。私がこの記事を書いている時点で、Anthropicの幹部はワシントンD.C.におり、彼らは誤解だと主張しているが、ホワイトハウスの官僚は、これは企業のリーダー層が合法的な国家安全保障の懸念に無関心であることの証拠だと示唆している。

多くの事実に争いがあるため、私はこの紛争について特に補足はないが、起きていることに驚きはない。すでに『Anthropicと整合性』で説明した通り、米国政府とAnthropicの対立は避けられないものだ。重要なのは、Mythosが十分に強力でないと考える人々は見落としている点だ。もし今の段階で十分に強力でなければ、次は、またその次は、特にモデルが後継者を作り出すのにますます役立つようになっている今、そうなる可能性が高い。

しかし、これには別の問題も浮上する。それは、嘲笑者の見解を裏付けるような疑問だ。もしMythosが非常に危険なら、なぜ最初にFableをリリースしたのか?なぜ政府と対立してまでやるのか?実際、私はAnthropicの行動は完全に理解できると考えている。彼らの独自性は、これらの行動をどう弁護するかにある。これらの弁護は、嘲笑者に燃料を与えるとともに、Anthropicに魔力をもたらす。

経済的必然性

AIの最初の数年間、最大の経済価値は計算能力に流れた。理由は明白だ。需要を満たす供給が不足していたため、価格が高騰したのだ。最大の恩恵を受けたのはNVIDIA、TSMC、メモリメーカー(SKハイニックス、サムスン、Micron)だった。一方、AnthropicとOpenAIは、最先端モデルの構築に数百億ドルの損失を出し、それらのモデルはリリース後、オープンソースのモデル蒸留と商品化によって中国からのものが主流となった。

これは研究所の悲観的な状況を示している。彼らはコストを常にカバーできず、差別化は一時的であり、無料の代替品が「十分良い」状態になる——これが合理的だと私は考える。モデルが互換性を持つ世界では、モデルは商品となり、多くの価値は他の場所に流れる。今は計算能力だが、時間とともに、十分な計算資源があれば、最も価値のある場所は常に変わらない。ユーザとの接点を持つ場所だ。

したがって、最先端の研究所は経済的にユーザに近づく必要がある。これは私には常に明らかだった。ユーザとの接点を持てば、ロックインが意味を持つ。そして、その最良の方法は、彼らが必要とするすべてのことのキャンバスになることだ。これにより、最先端の研究所はソフトウェア企業と衝突する方向に向かう。ソフトウェアはユーザとの接点を持ち、最先端の研究所の長期的利益は、単にソフトウェアの入力としての役割を果たすことではなく、ソフトウェアを直接置き換えることにある。

一方、ソフトウェア企業は逆のことをしようとしている。サティア・ナデラはX(旧Twitter)上の投稿で、モデルに関して彼のビジョンを次のように述べている。

「すべての企業は、私が言うところの人的資本とトークン資本を構築しなければならない。人的資本は従業員の知識、判断力、関係性、独創性、パターン認識を含み、トークン資本は企業が構築し所有するAI能力だ。重要なのは、トークン資本が増加しても人的資本の価値が下がることはなく、むしろより価値が高まることだ!私は、人間の主体性がトークン資本の成長を促すと信じている。人間は野心的な目標を設定し、分野を超えたつながりを築き、関係を構築し、最も重要なパターンを識別する。人間の指導なしに、あなたの計算能力は無駄になる。」

これは、真のチャンスは最良のモデルを選ぶことではなく、モデルの上に学習サイクルを構築し、人材資本とトークン資本を複利的に成長させることにあると示している。タスクや仕事をアウトソースできても、学習はアウトソースできない。企業の未来は、そのような学習を人とAIの間で複利的に成長させることだ。これには、新しいアーキテクチャが必要であり、各企業が時間とともに改善されるインテリジェントエージェントシステムを構築しつつ、知的財産権を保持できるようにすることだ。企業は、「汎用」モデルを置き換えても、その学習システムに内在する「企業のベテラン」専門知識を失わないようにすべきだ。これが未来の時代におけるコントロールと主権の「テスト」だ。

ナデラはこのビジョンを警告とともに始めている。

「私たちが望まないのは、すべての業界のすべての企業が価値を少数の飲み込み型モデルに奪われる世界だ。もしすべての価値が少数のモデルに集中すれば、政治経済はそれを容認しない。産業全体を破壊するAIの未来に対して、社会は許可しないだろう。」

グローバル化の第一段階で何が起きたかを考えれば、工業経済は外注により空洞化した。表面上はGDP数字は良さそうだが、実態は失われており、その結果は今も続いている。この動きをAI時代に持ち込まないようにしなければならない。少数のAIシステムがすべての経済的リターンを獲得し、産業全体が知識を商品化されていることに気づかせてはならない。

この比喩の問題は、グローバル化は実際に起き、工業経済は空洞化したという事実だ。これは警告ではなく予言かもしれない。ナデラが警鐘を鳴らすのも不思議ではない。なぜなら、Microsoftも被害者の一人かもしれないからだ。同様に、モデルメーカーの経済的必然性は、これを実現しようとしている。

データの必然性

これらのモデル、特にMythosは、その段階にはまだ到達していない。必要なのは、より多くの計算能力だけでなく、より良いデータだ。モデルの改良はますます強化学習に依存している。その中には合成生成もあるが、最も強力なレバーは実世界の使用だ。

私はこれがOpenAIとAnthropicの両方が大規模なサブスクリプションプランを提供している主な理由だと考える。SemiAnalysisは最近、200ドルのプランで8000ドル相当のClaudeトークンと14000ドル相当のCodexトークンを得られると推定している。もちろん、両者ともユーザと開発者の心のシェアを争っているが、実際の使用データへのアクセス権も争っているのだ。

AnthropicはFableに大きく投資し、すべての使用データを30日間保持すると発表した。これは、以前約束したゼロデータ保持の企業プランにも適用される。彼らはこれらのデータを訓練に使わないと述べているが、将来的にそうしない保証は何もない(例:第三者にデータを保存させるなど)。この方針変更(Fable再開時)が大量の顧客流出を引き起こさなければ、彼らがデータを使い始めるのは時間の問題だ。彼らの最終目標にとって、それはあまりにも価値が高すぎる。

また、ユーザとの接点を上昇させる良性ループにも注意が必要だ。ClaudeやCodexを使ったワークフローが増えれば増えるほど、各企業がフィードバックできる訓練データも増え、製品はより強力で有用になり、対応できるワークフローも拡大し、データへのアクセスも広がる。

ナデラは記事の中でこれらのデータの重要性を強調しつつも、モデルとは切り離して考えるべきだと述べている。

「企業は、ワークフロー、ドメイン知識、蓄積された判断を、使用ごとに改善されるAIシステムに変換する必要がある。プライベート評価は、モデルがビジネスにとって重要な結果を本当に改善しているか(外部基準だけでなく!)を捉えるべきだ。プライベートな強化学習環境は、組織内の実際の軌跡に沿ってモデルを強化できる。知識ベースは、組織の記憶をクエリ可能にし、トークンの効率的な使用を促進する。」

このループは企業の新たな知的財産となる。私はこれを登山ロボットに例える。多くの資産と違い、これは複利的に成長する。改善されたワークフローはより良い訓練信号を生み出し、企業固有の暗黙知の蓄積を加速させる。早期にこれを構築した企業は、どんな新しいモデル能力が登場しても、模倣し難い優位性を持つことになる。

このループは企業の新IPとなる。私はこれを登山ロボットとみなす。多くの資産と違い、これは複利的に成長する。改善されたワークフローはより良い訓練信号を生み出し、企業固有の暗黙知の蓄積を加速させる。早期にこれを築いた企業は、将来のモデル能力の向上に関係なく、模倣困難な優位性を持つ。

しかし、もしAnthropicのデータポリシーに従う企業が今すぐより良い結果を出せるとしたら?あるいは、既存の企業が抵抗し、新規企業やモデルメーカー自身に市場で勝つチャンスを残すとしたら?Anthropicは確かにナデラの呼びかける決断力を試している。

権力追求

FableやMythosのデータ保持ポリシーをめぐる議論は、最も論争の的となるリリース部分ではない。むしろ、Anthropicはリリース時に、FableがLLM開発に使われる場合、その性能を意図的に低下させると述べている。システムカードには次のように記されている。

「我々は最先端のLLM開発に関わる防護策も追加した。2026年2月のリスク報告第6.1節で議論したように、AI全体の発展を加速させるリスクを懸念している。これらのリスクの深刻さは未確定だが、特に——我々が当時書いたように——『他のAI開発者が我々のシステムと類似のリスクを持つ強力なAIシステムを構築するのを加速させること』に懸念を抱いている。」

最近のモデルは自己開発を加速させる能力を持つため、新たな介入策を導入し、Claudeの前端LLM開発リクエスト(例:事前学習パイプライン、分散訓練インフラ、MLアクセラレータ設計)に対する有効性を制限した。競合モデルの開発にClaudeを使うことはサービス規約違反だが、この制限を強制することで、最も規約違反を厭わない者の行動を抑制できる。

我々のサイバーセキュリティ、生物化学、蒸留の干渉と異なり、これらの防護策はユーザには見えない。Fable 5は別のモデルに切り替わることはなく、むしろ、プロンプトの修正や誘導ベクトル、パラメータの効率的微調整(PEFT)などの方法で効果を制限する。これらの干渉は、ほとんどのプログラミング作業には影響しないと見積もられる。これらは約0.03%のトラフィックに影響し、組織の0.1%未満に集中すると考えられる。これらの干渉が有効になった場合、最前線のLLM開発の有効性を制限する以外に、モデルの挙動にほとんど影響しないと予想される。Claudeは引き続きユーザのリクエストに役立つ応答を行う。リリース後も検出手法の精度向上を続ける。

Anthropicはこの変更を撤回し、FableはLLM関連リクエストをOpus 4.8に移行し、その旨をユーザに通知する予定だが、最初の方針は非常に示唆に富む。私は、Anthropicが競合他社を支援したくないという気持ちも理解できるが、同時に、Anthropicは自分たち以外の誰も最先端のLLMを作るべきではないと考えていることも明らかだ。

この方針は、Anthropicと戦争部との対立がわずか2か月後に発表されたことも注目に値する。戦争部はClaudeを合法的な用途に使いたいと望む一方、Anthropicは監視や自律兵器に対してより厳しい規制を求めている。このダウングレード措置は、Anthropicが自らのモデルを政策に沿うように密かに変更できる能力と意志の証左だ。言い換えれば、Anthropicは一部の批判者が指摘する、サプライチェーンリスクの最大の懸念を実証したとも言える。

しかし、この事件から導き出されるより広い結論は、Anthropicは自分たちの使い方に最終的な決定権を持つべきだと考えていることだ。彼らは、最先端のAIを開発すべきは自分たちだけだと考えているため、AIの最終的な決定権も自分たちだけにあるとみなしている。さらに、これをAIがすべての経済活動を担うとする声明と結びつけると、Anthropicのリーダー層は実質的にすべてとすべての人に権力を持ちたいと考えていることになる。

安全の物語

もちろん、Anthropicはそんな単純な表現はしない。むしろ、物語は安全性についてだ。

私は、Anthropicは今後ますます、さまざまなワークフローに合わせてカスタマイズされたエンドポイントを通じて、モデルの能力をエンドユーザに公開していくと予想している。APIの制限も始まるだろう。こうしたソフトウェアの代替やアクセス制限は、安全性を名目に行われるだろう。たとえAnthropicがエンドユーザに近い経済的要求を果たしていても。

Anthropicのデータ保持ポリシーの大きな変更の説明は、安全性だ。具体的には、すべてのユーザーデータを30日間保持することは、米国政府が懸念する脱獄行為を防ぐために必要だと主張している。もちろん、将来的には、安全性のためにこれらのデータを訓練に使う必要も出てくるだろう。

Anthropicの起源は、創業者の信念に根ざしている。OpenAIは安全性を十分に真剣に扱っていないと考え、彼らだけがAIを制御できると信じている。彼らは、安全性に特化しているため、他者をコントロールする権利があると考えている。

これらの安全性の理由について問題があるとすれば、それは、私にはそれらが効果的に見えるのは、Anthropicにとってそれらが理由ではないからだ。彼らは本当に、自分たちだけがスーパーインテリジェンスを信じており、危険を十分に気にしていると信じている。これが、次々と決定や政策、対立を正当化し、外部からはシニシズムと天真さの奇妙な組み合わせに見える。

OpenAIと比べると、その差は歴然だ。OpenAIがリードを失った理由の一つは、ChatGPTリリース後数年、内部で戦闘状態にあったことだ。かつての研究所は、突然、意図せず消費者向けテクノロジー企業になる重荷を背負わされた。OpenAIがこの対立を解決する過程で、多くの人材がAnthropicなどの企業に流出した。

一方、Anthropicは人材、使命、事業の一貫性を完璧に保っている。研究者には、危険を創造する機械神のビジョンを売り込み、危険に関心を持ち、危険に対処できる人間のイメージを持たせることができる。そして、その結果生じる政策変更は、ちょうどビジネスにとって都合の良いタイミングで起きている。これは、世界で最も美しい偶然の一つだ。

私はこの一貫性を尊重しつつも、恐れている。なぜなら、それは非常に効果的だからだ。最も近い類推はAppleだ。Appleは、ユーザに正しいことをさせるふりをして、自己中心的な行動を包み隠さない。そして、実際にそうしていることも多い。Anthropicも同じだ。ただし、私は、最も理解していると確信している人たちに、私が受け入れられるか拒否できるスマートフォンを作らせるのは一つのことだ。彼らに、民族国家の権力に匹敵する、あるいは超えるスーパーインテリジェンスを作らせるのは、はるかに問題だ。自分たちが人類に何が必要かを知っていると信じる知性の歴史は、汚れたものだ。なぜなら、彼らは自分たちの意図が善意だと信じ込み、実際にはそうでない行動に理由を与えてしまうからだ。

TSM-0.07%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし