ChatGPT と Claude はすべての仕事を根絶してしまうのか?

a16z パートナーのジョー・シュミットIVは、大規模モデルの実験室は横断的なタスクを主導するだけであり、真のAI応用の機会は垂直的なシナリオと複雑なワークフローに隠されていると指摘している。
(前提:Altmanが「AIは人類を滅ぼす」と予言を撤回:自分が間違っていたことに喜びを感じている、本心なのか?)
(背景補足:Googleが出資したAIルーティングプラットフォームOpenRouter、評価額13億ドル、年間成長率240%)

この記事の目次

トグル

  • 黄レンガ道
  • オズの国の他の場所
  • なぜオズの国の他の場所は魔女に占領されないのか
  • 販売分野の事例——11xのCEOからの実用的なアドバイス
    • 結果に焦点を当てる
    • 複雑な問題に取り組む
    • ガードレールは単に悪いことを防ぐためだけでなく、それが顧客がお金を払う理由でもある
  • 保険分野の事例——FurtherAIのCEOからの実用的なアドバイス
  • 自分がオズの国の他の場所にいるかどうかをどう判断するか?
  • 両者とも(そして今後も)勝つことができる

起業家や潜在的な従業員は常に私に同じ質問をしている:AIの応用層にはまだ構築すべき価値ある空間があるのか?それともOpenAIやAnthropicがすべてを一掃してしまうのか?

この質問の背後には、特別な「AI不安症」が隠されている。すでに結論を出している人もいるが、最も長続きする場所は、大型実験室の内部か、ロボットやハードテクノロジーなどの最先端分野——理論上は「実験室では触れられないもの」——に限られると。

もしすべてのソフトウェアがまもなく飲み込まれるとしたら、CodexやClaudeに仕事を直接奪われるか、未来のモデルによって自分の構築したすべてが無意味になるなら、逃げ出すしかない!

聞いてほしい、私はほとんどすべての人と同じくAI至上主義者だが、彼らは半分だけ正しいと思う。実験室は確かに多くの応用範囲を侵食している。しかし、「応用層」は単一で均質な機会ではない。正しい思考枠組みは:あなたは「黄色いレンガ道」(Yellow Brick Road)上にいるのか、それともオズの国(Oz)の他の場所にいるのか?

黄レンガ道は、実験室が進む道の略称であり、そこには膨大な資源が投入されている。実験室がコード生成、ライティング、画像作成などの問題を解決するのに最も適している理由は、これらの問題が「モデルの原始能力」の向上とともに改善されるからだ:預託と後託に投資した1ドルは、直接的に製品の品質向上につながる。

一方、オズの国の他の場所は、より複雑で、しばしば垂直的な分野の問題に満ちている。これらの問題は、単に企業ユーザーに標準ツールとコンピュータ操作権を持つ「汎用ツール」を提供するだけでは済まない。

その価値は、基底モデルの原始能力(もちろんこれも重要だ!)からではなく、その周囲の**支柱(scaffolding)**から来る。これらの構造が、特定の業界内で出力を信頼でき、規制に適合し、実運用に投入できるものにしている。

私たちは今、まさにこの状況が展開されているのを目の当たりにしている。OpenAIやAnthropicは、市場に対して次のメッセージを伝えている:彼らは、すべての問題を解決できる汎用AIの同僚を持つことはできない。彼らはすでに、企業向けにカスタマイズされたモデルを構築するための大規模な前線展開合弁計画を発表している。もし次のモデルのリリースだけで全てが解決すると考えているなら、これらのプロジェクトに何十億ドルも投資しないだろう。

だから、AI応用を開発して富を築きたいなら——黄レンガ道を避けて、オズの国の他の場所を開拓すべきだ。以下は、私たちや投資先の起業家たちが学んだ、何が実践的に効果的かについての経験だ。

黄レンガ道

起業するなら、黄レンガ道は最も明白な道だが、同時に最も危険でもある。高性能モデルを手に入れ、既成のコネクタ(Google Drive、Slack、Salesforce、Notion、GitHubなど)を差し込み、その上にエージェント(インテリジェントエージェント)を編成する層を展開する。まるで魔法のようだ!

問題は、これこそが実験室がCoworkやCodexを通じてやっていることだという点だ。明らかに、彼らはモデル自体を所有しており、これによりより良い利益率、コントロール、そして下流のベンダーに対する価格設定力を持つ。

しかし、おそらく最も重要なのは、彼らが「どの問題を完璧に解決できるか」の「アーキテクチャ選択」を握っていることだ。これまでのところ、「モデル+ツール呼び出し(tool calls)」のパターンに深く思考を重ねており、これは黄レンガ道の低段階の単純作業に必要なレベルだ。たとえ新興企業がCodexやClaude Codeをある程度超えたとしても、実験室は巨大な流通チャネルとAI分野で最も強力なブランドの光環を持っている。

もしあなたがAI応用企業で、同じコネクタを使い、サブエージェントも深い設定もなく、流通チャネルも持たないなら、その道は底なしの穴に向かっている可能性が高い。

オズの国の他の場所

新興企業にとって、これは絶望だけではない。黄レンガ道の外には巨大なチャンスがあり、そこでは明確なルートを持ち、複雑な問題を解決しながら顧客を獲得できる。

これらの企業は、エージェント体験を構築し、モデルをツール、自動化、統合(つまり:ソフトウェア)からなる複雑なネットワークに絡めている。これにより、多くの新興企業はデフォルトで垂直領域に属している。

彼らは、多段階・多役割の協働作業に集中し、特定の役割や垂直分野のタスクに対してサブエージェント(sub-agents)を設置できる。これはAnthropicやOpenAIの汎用プラットフォームでは到達できない領域だ:システム間でコンテキストを収集し、複数の承認者にルーティングする

これには、レガシーシステム(legacy systems)が関わることも多く、結果の確定性(曖昧さを許さない)を求められ、しばしば高付加価値の商業成果に直結している。

実験室はこれらの問題の価値の大きさをよく理解している:だからこそ、外部委託の配置部門を設立し、高級市場向けの強化学習事業も展開している。

なぜオズの国の他の場所は魔女に占領されないのか

この見解に対して反論もある。これまでのところ、モデルや実験室の空売りの進展は、あまり割に合わない賭けだったと。彼らは今後もより強くなり続け、最終的にはこれらの応用層企業の市場を飲み込むだろう。

実験室は確かに進歩し続けるが、私はオズの国の他の場所の企業が時間とともに自らを守る方法をいくつか挙げたい。

データと学習のフィードループ: あなたが内在化している多くのものは、訓練データセットには存在しない——暗黙の業界規範、記録されていない標準、そして従事者の知恵の集合体だ。これらは公開ウェブ上には見つからない。いくら訓練計算資源を投入しても、これらの知識が実際に存在する「ワークフロー」の中にいることに勝るものはない。

ここには二つの相互に積み重なるフィードループがある:一つは顧客間のフィードループ(同じ問題のバリエーションを見れば見るほど、パターンが複利的に増幅される);もう一つは顧客内のフィードループ(特定の意思決定の背後にある理由、暗黙の例外、会社の経験則など、システムとの実際のやりとりを通じて浮かび上がるもの)。

100回の法的条項修正(redlines)、1000回の保険引受サイクル、1万回の営業活動を経た企業は、その問題の本質を内在化している。これは、新規にエージェントを立ち上げるときに模倣できない。評価セット(Eval sets)、ラベリングされた出力、エッジケースの分類法は、垂直領域特有のデータフィードループを形成し、微調整(fine-tuning)の推進力となる。

モデルの変動性と複雑性の管理: 実験室はすでにルーティングを行っている——異なるリクエストには異なるモデルレベルを使い、底層でアンサンブルを行う。しかし、「他社間のルーティング」や、特定のサブタスクに対して競合モデルを評価すること、または最適な細分化段階でオープンソースの微調整モデルを使うことはできない。「オズの国の他の場所」の企業は、モデル市場の中で各サブタスクに最適なモデルを選択している。

新しいモデルが登場するたびに、彼らは面倒な作業——アップグレード時の再評価、クライアントのエッジケースに合わせたプロンプトの再調整、運用環境を壊さずに展開——を引き受ける。実験室はこれらを代行しない。彼らは次のモデルを売りつけ、あなたに自己移行を促すだけだ。一方、オズの国の企業はこの移行コストを吸収している。

コスト最適化: 最新の最先端巨大モデルをすべてのクエリに使うのは、最速の赤字への道だ。最良の応用層企業は、異なるレベルのモデル間をルーティングする——最も難しいタスクには最先端モデルを、ほとんどの通常タスクには中間モデルを、特定の部分にはより小さな微調整モデルを使う。

実験室は最低価格を設定している:最低限の知能を提供するためにXドルで提供。オズの国の他の場所の企業は逆に——実際のワークフローに必要な特定の知能レベルに対して最低のコストを提供。これは、各サブタスクに必要なレベルを正確に理解している場合にのみ可能だ。

ガバナンス(Governance): 顧客がその垂直領域でAIを運用するためのコントロールプレーン(制御面)になることは非常に価値がある——ここは権限、監査、エージェントの許可範囲、実際に何をしたかの記録の交差点だ。

彼らはツール、ワークフロー、エージェントがアクセスするデータをエンドツーエンドで所有しているため、確定的な結果を提供できる。最終的な買い手にとっても、規制の複雑さを吸収する実体となる——法律の規則、医療のHIPAA、金融のSECやFINRA、州の保険規制などだ。CIOは、「彼らが提供するエージェントのコンプライアンス問題に対応している」と明記できるパートナーを望む。

これらすべては、焦点に帰着する。これは、垂直領域(保険、法律、会計)や深く掘り下げた職能(販売、顧客サポート、財務)に対しても同じだ。実験室はこれのために存在しているわけではない。彼らはどこにでもいて、誰にでもサービスを提供しなければならない——それが彼らが最新の黄レンガ道を築き続ける理由だ。同じようなトレードオフが、彼らをオズの国の他の場所から遠ざけている——あなたは同時にどこにでもいて、何かにおいて極めることはできない。両立は不可能だ。

販売分野の事例——11xのCEOからの実用的なアドバイス

実践的にこの問題をどう考えるべきか?以下は、11xのCEOプラバヴ・ジェインからの実用的なアドバイスだ。

結果に焦点を当てる

実験室に免疫のある企業の戦術的な道筋は、顧客が本当に気にしている「特定の結果」から直接始めることだ。私たちにとっては、それは企業の販売パイプラインを増やすことだ。

私たちが端から端まで持ちたいのは、パイプラインを駆動できる本当に効果的な活動だ。各活動をタスクに分解し、どれがエージェント化すべきか、どれがそうでないかを判断する。ワークフローが多段、多役割協働、現実世界の制約や入力の混乱を伴う場合、より良いモデルだけでは解決できない。この仕事は伝統的なソフトウェアエンジニアリングの領域だ。

例えば、私たちが扱うタスクは:カスタムシグナルに基づくリード開発、データの富化、深堀りしたアカウントリサーチ、CRMのコンテキスト取得、特定チャネルのメッセージ作成、リード資格審査エージェント、メール到達率システムなどだ。これらは一発で解決できるタスクではなく、深いエンジニアリングの蓄積が必要だ。実際のワークフローの半分はエージェント化されておらず、その部分には実験室の優位性は全くない

複雑な問題に取り組む

本当の商業価値を解き放つのは、複雑な問題だ。さもなければ、薄いラッパー(薄い包み紙)だけを作ることになる。

例として、市場開拓(GTM)の分野からの微小な例を挙げると、すでにあなたの顧客である企業に対して、その担当者に連絡しに行くべきではない、というものだ。

しかし、実際はそう単純ではない。子会社が数十社ある企業の場合はどうか?CRMの記録が親会社のドメインだけの場合は?システム内の期限切れのマッチングフィールドが、知らない開発提案のメールを既存のCROに送ってしまった場合は?この混乱から抜け出すには、その問題の具体的な形態に合わせた専用エージェントが必要であり、汎用のコパイロットではない。

ガードレールは単に悪いことを防ぐためだけでなく、それが顧客がお金を払う理由でもある

ガードレールの役割は過小評価されている。一つの規制対象の金融サービスの潜在顧客が求める保証と、中規模のSaaS顧客が求める保証は全く異なる。これらの保証は、エージェントの書き方、連絡先、アクセスできるデータ、記録の仕方にまで及ぶ。

この違いに対して一律のシステムは崩壊必至だ。ガードレールはシナリオに応じて構築し、顧客ごとに設定し、継続的に監査する必要がある。だからこそ、私たちはフロントライン展開エンジニア(FDE)や技術展開ストラテジストを持ち、各顧客のニーズに合わせて調整している。

保険分野の事例——FurtherAIのCEOからの実用的なアドバイス

販売の例に続き、保険もまた異なる角度から同じ見解を裏付けている。以下は、FurtherAIのCEOアマン・グールの見解だ。

「私たちが本格的に保険業務にAIを展開し始めたとき、ある仮説を耳にした:モデルこそが知性の本体であり、ワークフローはその周囲の足場に過ぎないと。

しかし、関わる保険会社が増えるにつれ、この見方は因果関係を逆にしていることに気づいた。保険業界では、多くの知性は実はワークフロー自体に存在している。

例えば、二つの保険会社は、同じように見える申請を通すことができる:提出、審査、見積もり、引受。だが、その最も単純な部分だけだ。差別化は、その背後にある細部にある:どのリスクを報告すべきか、どの損失信号が重要か、二つのアプリテイト(appetite)ルールが衝突したときにどちらが優先されるか、いつ人の手による承認が必要か、最終決定はどう記録されるか。これらのロジックは、きれいなルールエンジンに存在しない。SOP、マネージャーのレビュー、アンダーライティングの理念、長年の運用経験に散らばっている。

だからこそ、私たちは**エージェント化されたワークフロー(agentic workflows)**を構築し続けている。ワークフローは整然とした再現性、監査性、コストコントロールをもたらす。エージェントは変動性を処理し、通常ルートが失敗したときに修復を行う。人間は(human-in-the-loop)として、責任を伴う判断に関与し続ける。

時が経つにつれ、ワークフローは単なるスクリプトではなく、保険会社の**運用記憶(operating memory)**になり始める。これこそが実験室が到達しにくい部分だ。この理解は、実際にこのワークフローを何万回も運用したときに初めて得られる。最初に導入したワークフローは、堀を築くためのものではない。時間とともに、運用環境での閉ループが価値を生むのだ。」

自分がオズの国の他の場所にいるかどうかをどう判断するか?

  • ツールとステップのテスト(The tools-and-steps test): この作業には何ステップ必要か?それを支えるためにどれだけ複雑なツールを構築する必要があるか?比較してみよう:Google Driveを横断する水平型AI検索(単一ツール、単一ステップ、エラー許容度高)と、弁護士事務所の三年先例に基づく多段階の法的条項修正(複数ツール、多数のステップ、パートナーの審査を通す必要がある)。両者とも「エージェントの仕事」のように見えるが、後者は深層ソフトウェアの開発に何年もかかるタイプだ。

  • システムテスト(The system test): あなたは、クライアントが自らの作業を運用するための「システム」を構築しているのか、それとも既存のシステムの上に載せる「ツール」を作っているのか?システムは、データ収集、ガバナンス、完了した作業の記録をエンドツーエンドで持つ。一方、ツールは、クライアントの既存ワークフローに知能を付加するだけだ。高いACV(年間契約価値)は、システムのサインだ。なぜなら、システムは実際の人員を置き換えるからだ。自問しよう:もし、ある実験室があなたと直接競合する製品を出したら、顧客はあなたのツールを必要とし続けるだろうか?もしそうなら、それはシステムだ。

  • ヘッジファンド / 損益計算書のテスト(The hedge fund / P&L test): 実験室のパフォーマンスはベンチマークで評価されるが、オズの国の他の場所の企業は顧客の損益計算書(P&L)で評価される。あなたのモデルのベンチマークスコアは気にされない——彼らが気にするのは、あなたのエージェントが取引を促進したか、契約を正しく修正したかだ。最も優れたエージェント企業は、ヘッジファンドのように行動し、顧客の損益表で「超過リターン(Alpha)」を獲得して勝つ必要がある。

両者とも(そして今後も)勝つことができる

私たちは、黄レンガ道とその外側の両方で大きな勝者を見るだろう。モデル企業は、モデル自体と、それを流通させる汎用ツールのチャネルを持つことで勝つ。

一方、オズの国の他の場所の企業は、**ワークシステム(system of work)**を持つことができれば勝てる——それは、企業の実際の作業と、その結果得られるデータを捕捉するインターフェースだ。垂直領域のより複雑なワークフローが成熟すれば、それらは顧客のコア体験に融合していく。基底モデルは置き換え可能だが、ワークシステムは不可欠だ。

次世代のエンタープライズソフトウェアは、黄レンガ道の外側で誕生するだろう。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし