OpenAIはアプリケーション層を猛攻?a16z:チャンスは「黄砖路」以外にあり、起業家の機会はその先にある

a16zパートナーは、AI応用層は単一の戦場ではなく、スタートアップは大規模モデル企業の直接攻撃を避け、垂直産業の深耕に向かうべきだと指摘している。この記事はTwitter投稿に由来する。
(前提:GoogleはAIルーティングプラットフォームOpenRouterに出資、評価額13億ドル、1年で240%成長)
(補足:Sam Altmanがa16z創業者と対談:OpenAIはインフラに積極的に賭けており、Soraは重要な戦略ツール)

この記事の目次

Toggle

  • 不安拡大:大規模モデルは応用層を飲み込むのか?
  • 黄砖路の罠:横断ツールは死ぬ運命か?
  • オズの国のチャンス:垂直ワークフローの防御壁
  • コスト優位:モデルルーティングと後訓練
  • コントロールプレーン:コンプライアンスとガバナンスの価値

これはまさにa16zのジョー・シュミットがこの文章で答えようとしている問いだ。彼は『オズの魔法使い』の「黄砖路」を比喩に用い、AI応用の機会を二つに分けている。一つは大規模モデル企業が直接進出しているメインルート、例えばコード生成、ライティング、画像生成、汎用エージェント、横断的オフィスアシスタントなど。もう一つは「オズの国の他の場所」、つまり産業プロセスに深く入り込み、複雑なワークフロー、データの蓄積、コンプライアンス・ガバナンス、システム統合能力に依存する垂直シナリオだ。

彼の見解では、スタートアップの真のチャンスは後者にある。

販売から保険まで、ジョー・シュミットは一貫して同じロジックを強調する:企業が本当に支払いたいのは、より賢いチャットウィンドウではなく、ビジネス結果に責任を持つシステムだ。それは顧客データの混乱状態を理解し、多人数承認や境界ケースを処理し、コンプライアンスや監査責任を負い、モデルの継続的なアップグレードに伴い、顧客の移行、ルーティング、コスト最適化を代行する必要がある。

これこそが次世代企業ソフトウェアの核心的判断だ:基盤モデルはますます強化され、代替可能になっていく。しかし、真に代え難いのは、具体的な産業やワークフローに蓄積されたデータ、プロセス、ガバナンス能力、運用記憶だ。AI応用企業の機会は、モデル企業と「黄砖路」を争うことではなく、より複雑で汚れた、遅いが真の商業価値に近い場所に進むことにある。

最近、私は創業者や潜在社員から同じ質問を何度も聞いている:AI応用層にはまだ何ができるのか?それとも、OpenAIやAnthropicが最終的にすべてを殺し尽くすのか?

この問いの背後には、典型的なAIの不安がある。すでに結論を出している人もいる:もしも永久的な基盤に堕ちたくなければ、大規模モデルの実験室内か、ロボット、ハードテク、最先端の領域で起業すべきだ——理論的には、「実験室では触れられない」ものをやることだ。なぜなら、すべてのソフトウェアが飲み込まれるなら、CodexやClaudeに仕事を吸収されるか、将来のモデルによって不要になるからだ。最良の選択は、速く逃げることだ!

認めるが、私もほぼAIの極大主義者だ。そして、彼らの言うことの半分は正しいと思う。大規模モデルの実験室は確かに応用層の広大な領域に進出している。しかし、「応用層」とは均質な機会の集合ではない。本当に重要な判断基準は:あなたは「黄砖路」を進んでいるのか、それともオズの国の他の場所にいるのかだ。

注:「黄砖路」は『オズの魔法使い』の中で、エメラルドシティの中心地、魔法使いに会いに行くメインルートを指す。

いわゆる「黄砖路」とは、大規模モデル実験室が進み、巨額の資源を投入しているルートを指す。コード生成、ライティング、画像制作といった問題は、モデルの原始能力の向上とともに自然に良くなるため、実験室に適している。投入した1ドルは、事前訓練と後訓練の改善に直結し、製品の質を高める。

しかし、オズの国の他の場所には、より複雑で、しばしば垂直的な問題が存在する。それらは単純に企業ユーザーに横断ツールを提供し、標準ツールやコンピュータ操作能力をつなぐだけでは解決できない。ここでの価値は、モデル周囲の足場にある:これらの足場は、出力を特定産業で信頼でき、コンプライアンスを満たし、実際の業務フローに入り込むことを可能にする。基盤モデルの原始能力はもちろん重要だが、それだけでは不十分だ。

私たちはこれをリアルタイムで目の当たりにしている。OpenAIやAnthropicは、実際に市場に認めさせている:彼らは万能のAI同僚で全てを解決できるわけではないと。彼らは大規模な最前線の合弁事業を投入し、企業向けのカスタマイズと配置を構築している。もし次のモデルリリースでこれらの問題が解決できると本気で考えているなら、何十億ドルも投資しないだろう。

不安拡大:大規模モデルは応用層を飲み込むのか?

だから、AI応用で稼ぎたいなら、「黄砖路」を進むのではなく、オズの国の他の場所に進むべきだ。以下は私たちと投資先創業者が実践から学んだ経験だ。

もしあなたが会社を創るなら、黄砖路は最も目立つ道だが、最も危険でもある。高性能モデルを手に入れ、Google DriveやSlack、Salesforce、Notion、GitHubといった既存のコネクタをつなぎ、そこに知能のオーケストレーション層を構築する。まるで魔法のようだ。

問題は、これこそが大規模モデル実験室がCoworkやCodexを通じてやっていることだという点だ。明らかに、彼らはモデルを持ち、より良い利益率と制御力を持ち、すべての下流参加者に価格設定権を行使できる。しかし、より重要なのは、彼らが何の問題を解決すべきかの構造選択を握っていることだ。これまで彼らは「モデル+ツール呼び出し」のパターンを意図的に採用してきた。これはまさに、黄砖路上の横断的、低ステップ数の仕事に必要なパターンだ。たとえスタートアップがCodexやClaude Codeを超える何らかの方法を見つけても、大規模モデル実験室は巨大な配信能力と、AI分野で最も強力なブランドのオーラを持ち続ける。

もしあなたがAI応用企業で、同じ戦略を採用しているなら:同じコネクタをつなぎ、下層の知能体や配置もなく、配信チャネルも持たないなら、あなたは虚無への一本道を歩んでいる可能性が高い。

スタートアップにとって、悲観的ばかりではない。黄砖路の外側には、まだ巨大なチャンスがある。これらの場所で顧客を獲得し、複雑な問題を解決できる。

これらの企業は、知能体体験を構築している:モデルを複雑なツール、自動化、統合ネットワークに織り込む——つまりソフトウェアだ。これにより、多くのスタートアップは自然に垂直化される。多段階、多関与者のワークフローに集中し、異なる役割や垂直シナリオに合わせたサブ知能体を設計し、AnthropicやOpenAIの横断プラットフォームでは届きにくい問題を解決する:システム間でコンテキストを収集し、タスクを複数の承認者にルーティングする。

これらの仕事は、しばしばレガシーシステムや確定性結果を必要とし、曖昧性は許されず、時には重要なビジネス結果に直結する。大規模モデル実験室はこれらの問題の価値を理解しているため、外部委託の設定チームを構築し、エンタープライズ向けの強化学習サービス群も出現している。

これに対する反論は:今のところ、モデルや実験室に賭け続けるのは非常に悪い取引だということだ。彼らは確実に進化し続け、最終的にはこれらの応用層企業の市場を飲み込むだろう。

大規模モデル実験室は確かに進歩し続ける。しかし、私は長期的には、オズの国の他の場所の企業にはいくつかの防衛策があると考える。

多くのビジネスにおいて、内在化されているものは訓練データに存在しない:暗黙の産業慣例、記録されていない標準、従事者の暗黙知だ。これらは公開インターネット上には存在しない。どれだけ訓練計算資源を投入しても、これらの知識が蓄積されたワークフローの内部に入り込むことはできない。

ここには二つの飛輪が重なる:一つは顧客間の飛輪、同じ問題の変種を多く見れば見るほど、パターンは指数関数的に増える。もう一つは顧客内の飛輪、具体的な意思決定の背後にある理由や、明示されていない例外、企業の経験則だ。これらは、ユーザーとシステムが真に相互作用して初めて浮かび上がる。

黄砖路の罠:横断ツールは死ぬ運命か

たとえ顧客データが顧客間で共有できなくても、応用企業は異なる顧客問題タイプのパターン認識を利用し、それを未来の問題設計に役立てられる。ある企業が100回以上の法的リスク修正や1,000回の保険審査サイクル、1万回の営業活動を経験していれば、その問題形態の理解は、後から新たに知能体を起動した者が模倣できるものではない。

理論上、横断的知能体も同じ学習基盤を築けるはずだが、その理由は、集中度不足以外に、ユーザー体験の問題が大きい。知識をキャプチャするには、提供するワークフローインターフェースが重要だ。垂直プレイヤーは、特定のワークフローに必要な情報を真に露出させる設計を行えるが、横断ツールはそれができない。評価セットや出力の注釈、境界ケースの分類体系は、垂直領域のデータ飛輪に複合され、微調整も支援できる。後発者が同規模の生産環境を持たなければ、この飛輪は生成できない。それが可能かどうかは、データの権利、蓄積された生産利用量、顧客契約の構造に依存するが、パターン認識自体は継続的に蓄積される。

大規模モデル実験室はすでにルーティングを行っている:異なるリクエストに対して異なるモデルを呼び出し、基底層でモデル統合を行う。しかし、供給者間のルーティングや、特定のサブタスクに最適なオープンソース微調整モデルの評価、狭い範囲での最適モデルの選択は難しい。

オズの国の他の場所の企業は、市場全体で各サブタスクに最適なモデルを選び、単一の大規模モデルに頼らない。新モデルのリリースごとに評価をやり直し、境界ケースのプロンプト調整を行い、実運用に影響を与えずにアップデートを完了させる。大規模モデル実験室はこれらを代行しない。彼らは新モデルを売りつけ、移行を促すだけだ。オズの国の他の場所の企業は、移行コストを吸収し、最良の知能能力とアップグレードの連続性を顧客に提供する。

Opus 4.7にすべてのクエリを投げるのは、利益率をマイナスにする最速の道だ。最良のオズの国の企業は、複数のモデル間でルーティングを行う:最も難しいタスクは最先端モデルに任せ、大部分は中程度のモデルに、既に証明された場所では小型の微調整モデルやカスタムモデルを使う。

これらの企業の一部は、既に後訓練を行い、モデルを顧客が本当に関心を持つ作業に最適化し、APIコールよりも遥かに低コストでサービスを提供している。大規模モデル実験室は「最低価格」の価格設定を行う:Xドルで最低限の知能レベルを買える。対して、オズの国の企業は、特定のワークフローに必要な知能レベルを実現し、最低のドルコストを追求する。各サブタスクに必要な知能レベルを明確に理解している場合にのみ可能だ。大規模モデル実験室は、構造的に各垂直産業のすべてのタスクを理解できないため、最終的にはより低く、よりコントロールされた結果の価格設定に直結する。

特定の垂直分野でAIを制御するコントロールプレーンになることは、非常に価値がある。このコントロールプレーンは、許可権、監査、知能体の許容範囲、実際の活動を集約する場所だ。

このコントロールプレーンは、具体的なユースケースのガードレールに基づいて構築される。異なる産業や役職タイプごとにガードレールは異なる。これらの企業は、知能体が触れるツール、ワークフロー、データを持ち、横断ツールでは実現しにくい確定的な結果を提供できる。さらに、最終顧客の規制複雑性も吸収する:米国連邦民事訴訟規則や弁護士の執務規則、HIPAA、SECやFINRA規則、州の保険監督などだ。横断プレイヤーがこれらの垂直産業に特化しなければ、説得力を持てない。CIOは、提供する知能体に対してコンプライアンス責任を明示できるパートナーを求めている。

すべては結局、「集中」に帰着する。

この集中は、保険、法律、会計といった垂直産業か、営業、カスタマーサポート、財務といった職能の深堀りかのいずれかだ。いずれも、長期にわたり同じ顧客層に密着し、ワークフロー、境界ケース、規制要件を理解するチームが必要だ。大規模モデル実験室はこれを目的としていない。すべての人、すべての場所をカバーしようとした結果、最初に黄砖路を築いた理由だ。同じ選択は、オズの国の他の場所に進むことも難しくする:全方位に広がるか、特定のことに極めるか、二者択一だ。

実践的にどう理解すればいいか?以下は11x CEOのPrabhav Jainが示す実務的なアドバイスだ。

オズの国のチャンス:垂直ワークフローの防御壁

大規模モデル実験室の衝撃に耐える企業を作るには、顧客が本当に関心を持つ具体的な結果から始めるのが有効だ。私たちにとって、その結果は、企業の営業リードと商談を増やすことだ。

そこから、非常に具体的な問題に変わる:どの活動をエンドツーエンドで所有し、実際に商談増に寄与できるのか?各活動をタスクに分解し、どのタスクが知能体に適しているか、どれがそうでないか?複雑な領域洞察を必要とするか、不要か?大規模モデル実験室もワークフローを出すが、ステップが多く、入力が混乱し、状態の説明が難しい、あるいは現実の制約がある場合、単に良いモデルを持つだけでは解決できない。こうなると、仕事は従来のソフトウェア工学に戻る。そこでは、大規模モデル実験室は、焦点を絞った応用企業に比べて優位性がない。

例を挙げると、私たちが扱うタスクには、カスタムシグナルに基づく潜在顧客発掘、潜在顧客情報の補完、深堀りアカウントリサーチ、CRMからのコンテキスト抽出、異なるチャネル向けの情報作成、潜在顧客資格判断の知能体、メール配信システムなどがある。これらは知能体のタスクもあれば、そうでないものもある。これらは一回のプロンプトだけで完結しない。深いエンジニアリング能力が必要だ。

オズの比喩の重要な洞察は、実際のワークフローの中で、ざっと見て半分は非知能体のタスクであり、その半分は実験室の優位性をもたらさないことだ。モデル層の下では、それらは確定性ソフトウェアの記述能力に勝てない。一方、知能体のタスクも、真に望む結果に沿ってモデルの調整や訓練、制約を行う必要がある。

分野知識は、一般的な訓練データには存在しないことが多い。これらの能力は、垂直産業や具体的な職能から下から積み上げ、ワークフローの適切なタイミングでモデルに供給される必要がある。たとえば、電話で入札リードの適格性を判断させる場合、そのモデルは、特定産業や特定ユーザープロファイルにとって良い営業会話とは何かを理解している必要がある。これが応用企業の仕事であり、その能力は複利的に蓄積される。

さらに重要なのは、これらの能力は絶えず陳腐化することだ。企業自体も進化しているからだ。したがって、ワークフローやコンテキストの継続的な進化は、競争優位の源泉となる。例えば、メールアウトリーチの規模拡大を始めたとき、「AIが書いたメール」が出現し始めた。今では、AIが書いたか人間が書いたかの判別感覚が鋭くなり、その判断は数ヶ月ごとに変わる。私たちの知能体は、市場動向に合わせて調整し続ける必要があり、その護城壁はここに築かれる。実際、動的な変化にもかかわらず、私たちの返信率は過去数ヶ月で4倍に上昇し、数億ドルの商談を創出している。

複雑な問題こそ、商業価値を本当に解き放つ場所だ。さもなければ、薄いパッケージングだけをやっていることになる。

いかに複雑なビジネス問題を分解しても、すぐに混乱が見えてくる。GTM領域の例で、非常にシンプルに聞こえるものを挙げると、すでに顧客の会社に連絡すべきではないとわかっているのに、実際にはそうできないケースだ。

たとえば、CRMにその会社のドメイン名が記録されている場合、どうなるか?子会社が複数ある企業はどうか?親会社のドメイン名しか記録されていなかったら?Salesforceの古いマッチングフィールドが原因で、既存顧客のCROに冷やかしの営業メールを送ってしまったら?実世界のデータは混乱している。人間でも処理は難しいし、モデルもこの門を超えられない。こうした混乱から秩序を作るには、問題の具体的な形態に合わせた知能体を設計する必要がある。単にCRMに副操縦士を向けるだけでは不十分だ。実際、私たちの持つデータの質と鮮度は、顧客自身のそれを上回っているため、デフォルトでは自社のデータを錨にしている。

ガードレールの重要性は過小評価されている。同じ製品内でも、ユースケースごとにガードレールは異なる。規制のある金融潜在顧客と、中規模SaaS顧客では、求められる保証はまったく違う。これらの保証は、知能体の書き方、連絡先、アクセスできるデータ、電話での発言内容、意思決定の記録にまで波及する。

一律のシステムは、こうした差異に耐えられない。ガードレールはユースケースごとに構築し、顧客ごとに調整し、継続的に監査される必要がある。これらはすべて応用企業側の仕事だ。だからこそ、最前線のデプロイエンジニアや技術配置戦略家が必要となる。

コスト優位:モデルルーティングと後訓練

例を挙げると、私たちはある財閥系の機関と協力し、音声を用いて膨大な中小企業向け顧客に同意の上でアウトバウンドを行った。最初の数ラウンドは応答率が低かった。そこで迅速に反復し、通話の最初10秒で反応を引き出す方法を学習した。中小企業の経営者の行動は、大企業のB2Bバイヤーや消費者とまったく異なる。今では、彼らのために1日あたりの商談創出数は、その市場の営業チーム1ヶ月分を超えている。

販売だけでなく、保険も同じことを示している。以下はFurtherAIのAman Gourが「黄砖路からの脱出」について理解した内容だ。

保険業界にAIを導入し始めると、よく耳にする仮説がある:モデルが知能で、ワークフローはモデルの周囲に構築された足場だと。

しかし、私たちが関わる保険会社が増えるほど、逆だと確信している。

保険業界では、多くの知能はワークフローの中にすでに存在している。二つの保険会社が、同じ提出書類の流れをたどるとしよう:提出、審査、見積もり、引き受け。ルート自体は簡単だ。真に差別化されるのは、その内部のすべてだ:どのリスクをエスカレーションするか、どの損失信号が重要か、二つの引き受けルールが衝突したときの優先順位、いつ人間の承認が必要か、外部データの取り込み、最終的な意思決定の記録方法。

これらのロジックは、きれいなルールエンジンには存在しない。標準操作手順、マネージャーの監査、引き受け哲学、保険会社固有のリスク嗜好、長年の運用経験に散らばっている。多くは、モデルが直接読める形で書かれていない。

だから、私たちは、毎回ゼロから推論する純粋な知能体や、現実の複雑性に直面して崩壊する硬直したワークフローは信じていない。むしろ、知能体のワークフローを構築している。ワークフローは再現性、監査性、コストコントロールをもたらす。知能体は変動性を処理し、理想的なルートから逸脱したときに流れを回復させる。人間は、判断や責任の関わる部分で、常にそこにいる。

最初はこのシステムは人の手作業を自動化するだけだったが、時間とともに、各アップグレードはシグナルとなり、例外はフィードバックとなり、人間の修正は操作マニュアルの不備を示す。やがて、ワークフローは単なるスクリプトから、保険会社の運営記憶へと進化する。

これこそが、大規模モデル実験室が到達しにくい領域だ。彼らはより良いモデルと汎用知能体をリリースし続けるべきだが、保険会社の生産ワークフローの中で、なぜ特定のアカウントがアップグレードされたのか、なぜリスクが拒否されたのか、なぜ引き受け担当者がリスク嗜好ガイドラインを覆したのか、その理由を学習し続けることはできない。

この理解は、同じワークフローを何万回も実行してきた実運用の中からしか得られない。最初に提供したワークフローは護城壁ではない。運用の循環の中で形成される記憶こそが護城壁だ。

これが、「黄砖路からの脱出」の意味だ。

コントロールプレーン:コンプライアンスとガバナンスの価値

この仕事には何ステップ必要か?それを支えるツールはどれほど複雑か?

Google Drive内の横断AIによる検索と比較してみよう:これはツールの一つの操作ステップに過ぎず、エラー許容率も高い。ユーザーは要約を読んで誤りがあれば、再度質問すれば良い。

一方、過去三年の判例に基づき、多段階の法的リスク修正を行うタスクはどうか:数十のステップ、多数のツールを使い、出力はパートナーの審査を経て、裁判所での弁論も必要になるかもしれない。どちらも「知能体が仕事をしている」ように見えるが、後者は深いソフトウェアを長年構築した専門チームの仕事だ。

あなたは、顧客の仕事を実行するシステムを構築しているのか、それとも既存のシステムにツールを追加しているのか?

システムはエンドツーエンドのワークフローを持つ:データ収集、ガバナンス、作業完了の記録だ。顧客は、実際の仕事の流れを説明するとき、そのシステムを指す。ツールは、すでに実行中のワークフローに知能を追加するだけだ。

ツール型製品も実収益を生むことができるが、大規模モデル実験室はそれを奪いやすい。なぜなら、顧客はあなたをオーケストレーション層として頼っていないからだ。高いACVは、システム型製品の指標となる。なぜなら、システムは実際の人手を代替し、その対価を得るからだ。ただし、これは絶対的な保証ではない。もし大規模モデル実験室が、あなたと直接競合する製品を出したら、顧客はあなたのツールを必要とし続けるだろうか?必要なら、あなたはシステムを構築している。必要ないなら、あなたはツールだ——たとえACVが高くても。

大規模モデル実験室のパフォーマンスは、ベンチマークテストで評価される。一方、オズの国の他の場所の企業のパフォーマンスは、顧客の損益計算書で測られる。

顧客は、あなたのモデルがSWE-BenchやMMLUで何点取ったかには関心がない。彼らが気にするのは、あなたの知能体が商談を成立させたか、契約リスクを正しく修正したか、正しい保険証券を引き受けたかだ。もし顧客が、汎用能力のスコアではなく、特定のワークフロー結果に関心を持つなら、あなたはオズの国の他の場所にいる。もし顧客が、汎用能力を売りにしているなら、彼らはClaudeやCodexを通じて得られるものを買っている。

最良の知能体企業は、ヘッジファンドのように運用すべきだ:彼らはアルファで勝ち、アルファは顧客の損益計算書で測られる。ベンチマークスコアではない。

私たちは、黄砖路とその外側の両方で大きな勝者を見るだろう。モデルは進化し続け、横断ツールの配信能力も持つからだ。

オズの国の他の場所も勝てる。なぜなら、仕事のシステム——すなわち、企業が実際に仕事を行うインターフェースと、その中で流れ、蓄積されるデータ——を持っているからだ。これらの企業は、データキャプチャ、ワークフローシステム、ガバナンスを備え、特定の垂直分野の複雑なワークフローが成熟すれば、顧客にとって不可欠なコア体験となる。既存のプレイヤーや新規参入者が新世代モデルを次々にリリースする中、これらの企業は、モデルを統合し、顧客に届ける層となる。基盤モデルは代替可能だが、仕事のシステムはそうではない。

次世代の企業ソフトウェアは、黄砖路の外側に築かれる。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし