なぜOpenAIはむしろClaudeコードを追い求めているのか?

OpenAIのCEOサム・アルトマンは、オフィスチェアに脚を組み、天井を見上げながら、まだ形になっていない答えについて考えているようだ。ある意味、これは環境とも関係している。

OpenAIの新本社はサンフランシスコのミッションベイに位置し、ガラスと淡い木材を用いた現代的な建築で、「テクノロジーの聖殿」のような趣きがある。受付の後ろには「AI時代」(Eras of AI)を紹介するマニュアルが置かれ、技術的啓示への道筋を描いているかのようだ。階段の壁には人工知能の発展の節目を示すポスターが貼られ、その中にはこう記されている:何千何万もの観客がライブ配信を通じて見守る中、ある機械が《Dota 2》の試合でトップレベルのeスポーツチームを打ち負かした瞬間だ。廊下を行き交う研究員たちは、スローガン入りのチームグッズを着ている。その一つには「良い研究には時間が必要だ」と書かれている。もちろん、理想的にはそんなに長くはかからないはずだ。

私たちは巨大な会議室に座っている。私がアルトマンに投げかけた質問は、業界を席巻しているAIプログラミング革命に関するもので、なぜOpenAIがこの波の中でリードしていないのかということだ。

今や何百万ものソフトウェアエンジニアが一部のプログラミング作業をAIに任せ始めており、これによりシリコンバレーの多くの人々は初めて現実を直視している。自動化は彼ら自身の職をも脅かす可能性があるのだ。コーディングエージェント(coding agents)は、こうした中で少数の企業が高額を支払う価値のあるアプリケーションの一つとなっている。理論上、この瞬間は完全にあり得るし、むしろそうなるべきだとも思える。だが、今やヘッドラインを飾るのは、OpenAIではなく別の名前だ。

そのライバルはAnthropicだ。前OpenAIのメンバーが設立したAI企業で、Claude Codeを武器に爆発的に成長している。2023年2月に公開された同社の発表によると、この製品は同社の事業規模の約5分の1を占め、年収は250億ドル超にのぼる。一方、情報筋によると、2023年1月末時点で、OpenAIの自社開発のコーディング製品であるOpenAI Codexの年収は10億ドル強にとどまっている。

では、なぜこのAIプログラミング競争でOpenAIは遅れをとっているのか?

「先行優位の価値は非常に大きい」とサム・アルトマンはしばらく考えた後に言った。「これについては、ChatGPTで既に経験済みだ。」

しかし彼の見解では、今こそOpenAIがAIプログラミングに本格的に取り組むべき時だと考えている。彼は、既存のモデル能力は十分に強力で、高度なコーディングエージェントを支えることができると信じている。もちろん、その能力は偶然に得られたものではなく、何十億ドルもの投資をモデル訓練に注ぎ込んできた結果だ。

「これは巨大なビジネスになるだろう」とアルトマンは言う。「経済的価値だけでなく、プログラミングがもたらす汎用的な生産性の解放も含めてだ。」彼は一瞬間を置き、付け加えた。「この言葉を軽々しく使うことは少ないが、これはおそらく数兆ドル規模の市場の一つになるだろう。」

さらに彼は、OpenAI Codexは汎用人工知能(AGI)への最も有望な道筋の一つかもしれないと考えている。OpenAIの定義によれば、AGIとは、経済的価値のあるほとんどすべての仕事において人間を超える能力を持つAIシステムのことだ。

OpenAIのCEOサム・アルトマン。写真:Mark Jayson Quines。

しかし、アルトマンが落ち着いた態度で自信を持って判断を下している一方で、過去数年の社内の実情ははるかに複雑だ。より完全な内部事情を理解するために、私は30人以上の関係者にインタビューを行った。彼らには、現役のOpenAI幹部や従業員、匿名条件下で内部の運営を語った元社員も含まれる。これらの証言を総合すると、あまり見られない状況が浮かび上がる。OpenAIは今、追いかける側に回っているのだ。

時は2021年に遡る。当時、アルトマンと他のOpenAI幹部は、サンフランシスコのMission区にある彼らの初期オフィスにWIREDの記者スティーブン・レビーを招き、新技術のデモを見せた。これはGPT-3を基盤としたプロジェクトで、GitHubの大量のオープンソースコードを用いて訓練されたものだった。

現場デモでは、OpenAI Codexと呼ばれるツールが自然言語の指示を受けて、簡単なコード片を生成する様子が披露された。

「実際、コンピュータの世界であなたの操作を代行できるんだ」と、当時のOpenAIの社長兼共同創設者グレッグ・ブロックマンは説明した。「あなたが持つのは、命令を実行できるシステムだ。」当時の研究者たちもすでに、Codexは「スーパーアシスタント」の構築において重要な技術になると考えていた。

その頃、アルトマンとブロックマンのスケジュールはほぼMicrosoftとの会議で埋まっていた。MicrosoftはOpenAIの最大の投資者であり、Codexを利用した商用AI製品の一つに技術支援を提供しようとしていた。これがGitHub Copilotというコード補完ツールで、プログラマーの日常的な開発環境に直接組み込まれるものだ。

ある早期のOpenAI社員は、当時の状況についてこう振り返る。「基本的には自動補完しかできなかった。でも、Microsoftの幹部はこれをAI時代の到来の重要な兆候と見なしていた。」

2022年6月にGitHub Copilotが正式リリースされると、わずか数か月で数十万のユーザーを獲得した。

OpenAIの社長グレッグ・ブロックマン。写真:Mark Jayson Quines。

最初にCodexを担当していたOpenAIのチームは、その後、他のプロジェクトに配置換えされた。一人の早期社員は、「当時の判断は、将来的にはモデル自体がプログラミング能力を持つようになるだろう、というものだった」と語る。つまり、Codexの専任チームを長期的に維持する必要はないと考えられたのだ。一部のエンジニアはDALL-E 2の開発に従事し、他の者はGPT-4の訓練に回された。当時の見方では、これがOpenAIをより近いAGIに近づけるための重要な道筋だった。

その後、2022年11月にChatGPTが登場し、2か月で1億人以上のユーザーを獲得した。社内のほぼすべての他のプロジェクトは、そのために停止を余儀なくされた。以降数年間、OpenAIにはAIプログラミング製品を担当する専任チームは存在しなかった。ある元Codex関係者は、ChatGPTの成功後、AIプログラミングはもはや「新たな消費者向け優先戦略」の範疇には入らなくなったと述べている。同時に、業界内ではこの分野はGitHub Copilot(Microsoftの主戦場)にほぼ「カバー」されていると一般的に考えられていた。OpenAIはあくまで基盤となるモデルの提供に徹していたのだ。

したがって、2023年と2024年、OpenAIのリソースは多模態AIモデルやインテリジェントエージェントにより多く割かれることになる。これらのシステムは、テキスト、画像、映像、音声を同時に理解し、人間のようにカーソルやキーボードを操作できるよう設計された。こうした方向性は、その時点では業界の潮流に合致していると見られた。Midjourneyの画像生成モデルがSNSで急速に人気を博し、「大規模言語モデルは世界を『見て』『聞いて』理解できる必要がある」と業界は考えたのだ。

一方、Anthropicは異なる道を選んだ。同社もチャットボットやマルチモーダルモデルを開発しているが、より早い段階でプログラミング能力の潜在性に気づいていた。最近のポッドキャストでブロックマンは、「私たちは早い段階から『プログラミング能力に非常に焦点を当ててきた』と認めている」と述べた。彼は、Anthropicは学術コンテストの複雑なプログラミング問題だけでなく、実際のコードリポジトリからの大量の「混乱した」コードも訓練に取り入れていると語った。

「これは後になって気づいた教訓だ」とブロックマンは言う。

2024年初頭、Anthropicはこれらの実コードリポジトリデータを用いてClaude 3.5 Sonnetの訓練を開始した。6月にこのモデルが公開されると、多くのユーザーがそのプログラミング能力に感銘を受けた。

このパフォーマンスは、Cursorというスタートアップ企業で特に顕著だった。この会社は20代の若者たちが立ち上げたもので、AIコーディングツールを開発し、開発者が自然言語で要求を記述するとAIが直接コードを修正する仕組みだ。CursorがAnthropicの新モデルを取り入れると、ユーザーベースは急速に拡大したと、関係者は語る。

数か月後、Anthropicは自社のコーディングエージェント製品Claude Codeの内部テストを始めた。

Cursorの人気が高まる中、OpenAIは一時、同スタートアップの買収を試みた。しかし、複数の関係者によると、交渉が本格化する前に創業チームはこれを拒否した。彼らはAIコーディング業界の潜在力を高く評価し、独立を維持したいと考えていたのだ。

OpenAIのCodex研究責任者アンドレイ・ミシェンコ。写真:Mark Jayson Quines。

当時、OpenAIは最初の「推論モデル」OpenAI o1の訓練を進めていた。このモデルは、答えを出す前に段階的に推論を行うことができる。OpenAIはリリース時に、このモデルは「複雑なコードの正確な生成とデバッグ」において特に優れていると述べた。

ミシェンコは、AIモデルがコーディング能力で明らかに進歩した理由の一つは、「検証可能なタスク」(verifiable task)であることにあると説明する。コードは動作するかしないかの二択であり、これがモデルに非常に明確なフィードバック信号を与えるのだ。間違いがあれば、システムはすぐにどこが問題かを認識できる。OpenAIはこのフィードバックループを活用し、より複雑なプログラミング問題に対してo1を訓練し続けた。

「コードベース内で自由に探索し、修正を実施し、自身の結果をテストする能力——これらはすべて『推論』能力の一部だ——がなければ、今日のコーディングエージェントはこれほどのレベルには到達できなかっただろう」と彼は言う。

2024年12月までに、OpenAI内部では複数の小規模チームがAIコーディングエージェントに専念し始めた。その一つのチームはミシェンコとティボー・ソティューが共同リーダーを務める。ソティューはGoogle DeepMind出身で、現在はOpenAIのCodex責任者だ。

彼らの関心は、当初は内部の研究開発ニーズから始まった。AIを使って大量の反復作業を自動化し、モデル訓練やGPUクラスターの監視などを効率化することだった。

並行して、アレクサンダー・エンビリコスが主導した試みもあった。彼は以前、OpenAIのマルチモーダルエージェントプロジェクトを担当し、現在はCodexのプロダクト責任者だ。エンビリコスは、「Jam」というデモプロジェクトを開発し、社内で急速に広まった。

OpenAIのCodex責任者ティボー・ソティュー。写真:Mark Jayson Quines。

マウスとキーボードを使ってコンピュータを操作するのとは異なり、Jamはコマンドラインに直接アクセスできる。2021年のCodexデモは、AIが人間のためにコードを生成し、人間が手動で実行するだけだったが、エンビリコスのバージョンは自動的にコードを実行できる。彼は振り返る。「当時、リアルタイムでJamの操作を記録したウェブページが自分のノートパソコンで絶えず更新されていて、ほとんど衝撃を受けた。」

「しばらくの間、マルチモーダルなインタラクションが我々の使命を実現する道だと考えていた。例えば、人間が一日中AIと画面を共有しながら作業する、といったことだ」と彼は言う。「しかし、突然、非常に明確になった。もしかすると、モデルにコンピュータへのプログラム的アクセス権を直接与えることこそが、本当の解決策なのかもしれない、と。」

こうした散発的なプロジェクトは、数か月をかけて徐々に一つの方向性に統合された。2025年初頭、OpenAIがOpenAI o3の訓練を完了したとき、それはより高度に最適化されたプログラミング用モデルだった。これにより、同社は本格的なAIコーディング製品の構築基盤を手に入れた。一方、AnthropicのClaude Codeはすでに公開準備に入っていた。

Claude Codeがリリースされる前(2025年2月に「限定研究プレビュー」として公開、5月に正式リリース)には、AIプログラミング分野の主流は「バイブコーディング」と呼ばれるスタイルだった。開発者はAI支援ツールを使ってプロジェクトを推進し、人間が方向性を決め、AIが具体的な実装を補助するというものだ。こうしたツールには数億ドルの投資が集まっていた。

しかし、Anthropicの新製品はこの流れを変えた。Jamのデモのように、Claude Codeはコマンドラインから直接操作でき、開発者のファイルやアプリケーションにアクセスできる。もはやAIは「補助」だけではなく、開発者が仕事の全工程をAIエージェントに任せることができるのだ。

この変化を受けて、OpenAIは競合製品の迅速な投入を加速させた。ソティューは、2025年3月に「スプリントチーム」を結成し、数週間で社内の複数チームを統合し、AIコーディング製品を早期にリリースすることを目指した。

同時に、アルトマンは「逆転優勝」を狙い、30億ドルでAIコーディングスタートアップのWindsurfを買収しようとした。OpenAIの幹部は、この取引が成熟したAIコーディング製品と経験豊富なチーム、既存の企業顧客基盤をもたらすと考えたのだ。

しかし、この買収はその後停滞した。ウォール・ストリート・ジャーナルによると、問題はOpenAIの最大のパートナーであるMicrosoftにあった。MicrosoftはWindsurfの知的財産権へのアクセスを望んでいた。2021年以来、MicrosoftはOpenAIのモデルを使ってGitHub Copilotに技術支援を行っており、この製品は同社の決算説明会でも重要な役割を果たしていた。しかし、CursorやWindsurf、Claude Codeといった新たなAIコーディングエージェントの登場により、GitHub Copilotは旧世代のAIツールの域を出なくなった。もしOpenAIが新たなコーディング製品をリリースすれば、Microsoftにとっては好ましくない結果になる可能性もある。

この交渉は、OpenAIとMicrosoftの関係が最も緊迫していた時期に行われた。両者は協力契約の再交渉を進めており、OpenAIはMicrosoftのAI製品と計算資源のコントロールを弱めようとしていた。最終的に、Windsurfの買収はこの駆け引きの犠牲となった。2023年7月、OpenAIはこの取引を断念した。その後、GoogleはWindsurfの創業チームを採用し、残る社員は別のAIコーディング企業Cognitionに買収された。

「当時はもちろん、この取引が成立すれば良かったと思う」とアルトマンは語る。「でも、すべての取引をコントロールできるわけではない」。彼は、Windsurfの買収が「我々の進展をある程度加速させることができたかもしれない」とも述べる。一方、ソティューとエンビリコスは、引き続き製品開発とアップデートを続けていた。

2025年8月、アルトマンは一気に加速させる決断を下した。

アレクサンダー・エンビリコス、OpenAI Codexプロダクト責任者。写真:Mark Jayson Quines。

グレッグ・ブロックマンは、AIの能力を測る最も好きな方法の一つとして、自ら設計したミニゲーム「リバース・チューリングテスト」を挙げる。数年前に自分でこのゲームのコードを書き、それ以来、AIエージェントにこのタスクを再実装させている。

ゲームのルールはシンプルだ。二人の人間プレイヤーがそれぞれ別のコンピュータの前に座り、各自の画面には二つのチャットウィンドウが表示される。一つはもう一人の人間プレイヤーとつながり、もう一つはAIとつながっている。プレイヤーはどちらがAIかを推測しつつ、相手に自分がAIでないことを誤認させるように仕向ける。

ブロックマンは、昨年の大半の時間をかけて、OpenAIの最強モデルでこのゲームを構築するのに数時間を要したと語る。その過程では、多くの明確な人間の指示と協力も必要だった。しかし、昨年12月には、Codexは巧妙に設計されたプロンプト一つで、完全に動作するバージョンを直接生成できるようになった。底層には新しいGPT-5.2モデルが使われている。

この変化はブロックマンだけでなく、世界中の開発者も気づき始めた。AIコーディングエージェントの能力が突如として大きく向上したのだ。AIプログラミングをめぐる議論は、最初はClaude Codeに集中していたが、やがてシリコンバレーの技術界を超え、メディアの注目の的となった。

さらには、プログラミング経験のない一般ユーザーも、AIを使って自分のソフトウェアプロジェクトを直接作り始めている。

この利用量の爆発的増加は偶然ではない。この期間、AnthropicとOpenAIはともに多額の資金を投入し、より多くのAIコーディングエージェントのユーザーを獲得しようとした。複数の開発者はWIREDに対し、彼らのCodexやClaude Codeの月額200ドルのサブスクリプションプランで、実際には1000ドル以上の価値を持つ利用枠を得ていると語る。この「寛大すぎる」上限設定は、市場戦略の一環だ。まず開発者に日常業務でAIコーディングツールを使い慣れさせ、その後、企業向けには利用量に応じて課金する。

関係者によると、2025年9月時点では、Codexの利用量はClaude Codeの約5%だったが、2026年1月にはその比率は約40%にまで拡大している。

ITスタートアップで10年働いた開発者のジョージ・ピケットは、最近、Codexをテーマにしたオフラインの集まりを企画し始めた。

「明らかに、我々はAIエージェントによってホワイトカラーの仕事を代替している」とピケットは言う。「ただ、その社会的な意味については、正直なところ誰にもわからない。大きな衝撃をもたらすことは確かだが、私は未来に対しては比較的楽観的だ。」

一方、時価総額約110億ドルの効率化ソフトウェア企業Notionの共同創業者サイモン・ラストは、GPT-5.2のリリース後、彼と同社のコアエンジニアチームは主にCodexの使用に切り替えたと述べる。その理由は、安定性の向上だ。

「Claude Codeはしばしば『騙す』ことがある」とラストは言う。「タスクは進行中と表示されるが、実際には何も動いていないこともある。」

OpenAIの研究員ケイティ・シャイ。写真:Mark Jayson Quines。

OpenAIのCodexの挙動を研究するケイティ・シャイは、「Codexのデフォルトスタイルは『ドライブレッド(乾パン)』のようだ」と表現されることもあるが、むしろ多くのユーザーはこの無理のないコミュニケーションスタイルを好むようになってきていると指摘する。「多くのエンジニアリング作業は、批判的なフィードバックを受け入れることが本質であり、それを攻撃と捉えないことだ」と彼女は言う。

一方、大手企業もすでにCodexを採用し始めている。OpenAIのアプリケーション事業責任者Fidji Simoは、「ChatGPTはすでにAIの代名詞となっており、これがB2B市場で大きなアドバンテージになっている。企業はすでに馴染みのある技術を導入したいと考えている」と述べる。彼女は、OpenAIのCodex販売の核心戦略は、ChatGPTや他のOpenAI製品とセットで提供することだとも付け加えた。

Ciscoの社長兼最高製品責任者ジートゥ・パテルは、社員に対して、Codexのコストを気にする必要はないと明言した。重要なのは、このツールに早く慣れることだ。社員が「これらのツールを使うと自分が失業するのでは」と心配した際、パテルはこう答えた。「そんなことはない。でも、使わなければ失業する。競争力を失うからだ。」

今や、AIコーディングエージェントに対する不安は、シリコンバレーの技術界を超えて広がっている。ウォール・ストリート・ジャーナルは先月、Claude Codeの登場により、1兆ドル規模のテック株の売りが一部引き起こされたと報じた。投資家は、ソフトウェア開発がAIによって大規模に置き換えられるのではないかと懸念しているのだ。数週間後、AnthropicがClaude CodeをCOBOLを動かす旧システムの改修に使えると発表したことで、IBMの株価は25年ぶりの最悪の日を記録した。

一方、OpenAIもAIコーディングエージェントを一般に広める努力を続けている。同社はスーパーボウル期間中に、OpenAI Codexに関する広告を数百万ドルかけて放映したが、ChatGPTの宣伝は行わなかった。

Mission Bayの本社では、ほとんど誰もCodexの使用を説得される必要はない。私がインタビューした多くのエンジニアは、今や自分でコードを書くことはほとんどなく、ほとんどの時間をCodexと対話して過ごしていると語る。時には、「集団でコミュニケーションを取る」ことさえある。

本社の一角では、Codexを使ったハッカソンも行われた。約100人のエンジニアが大きな部屋に集まり、4時間以内に最良のデモプロジェクトを作るというものだ。OpenAIの幹部が前に立ち、ノートパソコンを見ながらマイクでチーム名を発表し、代表者たちが緊張しながらステージに上がり、自分たちのAIプロジェクトを紹介する。最終的に勝者にはPatagoniaのリュックサックが贈られた。

多くのプロジェクトは、Codexを使って開発されており、エンジニアの支援にも役立っている。例えば、Slackのメッセージを自動的に整理して週次レポートにまとめるツールや、OpenAIの各種内部サービスを解説するAIガイドのようなウィキペディア風の内部資料などだ。従来なら数日、あるいは数週間かかっていたこれらのプロトタイプも、今や数時間でできてしまう。

帰る途中、私はKevin Weilに出会った。彼はInstagramの元幹部で、現在はOpenAIの「OpenAI for Science」部門を率いている。彼は、「Codexは今、徹夜でいくつかのプロジェクトを片付けるのに役立っている」と話し、「翌朝に結果を確認する」と言った。こうした働き方は、彼や数百人のOpenAI社員の間で日常になっている。OpenAIの2026年の目標の一つは、「自動化されたインターン」を開発し、AIそのものの研究に役立てることだ。

Simoは、今後のCodexは単なるプログラミングツールにとどまらず、ChatGPTや他のOpenAI製品のタスク実行エンジンとなり、ユーザーのさまざまな実務をこなすことを目指していると述べる。アルトマンも、汎用的なCodexのバージョンをリリースしたいと考えているが、安全性の懸念も抱いている。

彼は、「2026年1月末、技術的な背景を持たない友人が、爆発的に流行しているAIコーディングエージェントのOpenClawのインストールを頼んできた」と語る。彼はこれを断った。理由は、「今はまだ良いタイミングではない」と考えたからだ。たとえば、OpenClawは重要なファイルを誤って削除する可能性もある。

皮肉なことに、その数週間後、OpenAIはOpenClawの開発者を採用した。

多くの開発者は、今やCodexとClaude Codeの競争はかつてないほど激しいと語る。しかし、これらのツールの能力が向上し、企業の管理者たちがますます仕事の中に取り入れるようになるにつれ、社会が直面すべき問題は、「どのAIコーディングツールを使うか」だけにとどまらなくなっている。

アメリア・グレース、OpenAI研究副社長兼整合性責任者。写真:Mark Jayson Quines。

一部の監督機関は、OpenAIがClaude Codeの追い上げ競争の中で、安全性の問題を後回しにしているのではないかと懸念している。非営利組織のMidas Projectは、OpenAIがGPT-5.3-Codexをリリースした際に、安全性へのコミットメントを弱め、ネットワークセキュリティの潜在リスクについて十分に開示しなかったと批判している。

これに対し、グレースは、「OpenAIは、Codexを推進するために安全性を犠牲にしているわけではない」と反論し、同社もまた、Midas Projectの安全性に関する誤解を指摘している。

たとえ去年、AIの発展を支援するために親AI的なスーパーPACやドナルド・トランプ支持の団体に2,500万ドルを寄付したOpenAIの共同創設者グレッグ・ブロックマンも、この新たな現実には複雑な感情を抱いている。

シリコンバレーのエンジニアたちの間では、ブロックマンは「極度に熱心な」管理スタイルで知られている。製品リリース前の夜遅くまでコードを徹底的に確認するタイプだ。ある意味、今のより「放任」的な働き方は彼にとって気楽になったとも言える。「過去には、多くの不必要な細部に頭を悩ませていたことに気づく」と彼は言う。

しかし、同時に、何十万ものAIエージェントの隊列のCEOとなり、これらのシステムに自分の目標やビジョンを実行させる立場になると、各問題の具体的な解決策に深く関わるのは難しくなる。

「ある意味、これは自分が問題の『脈拍』を失っているような感覚だ」と彼は語る。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン