世界モデル資金調達の祭典が盛り上がる、資本が兆円規模の物理AI分野に賭ける

证券时报记者 陈雨康

今年興起的「ロブスター」(OpenClaw)ブームは、人工知能(AI)が何でもできるかのような一面を示している。データをつかみ、コードを書き、大作を生成し、コンピュータを引き継ぐことができる。だが、ひとたび画面の外に出ると、ロボットが現実世界に直面したときは、幼い子どものようになってしまい、固定された手順どおりの動作しかできない。「モラベックのパラドックス」が、人類の汎用人工知能(AGI)への道のりをまたいで横たわっている。

世界モデルこそが、この困難を解く鍵である。世界モデルは、ロボットが物理世界の法則を本当に理解できるようにし、思考と推論の能力を与え、AGIの実現における重要な道筋となる。今年、チューリング賞受賞者の楊立昆が世界モデル企業を創業し、「AIの女神」と称される李飛飛の世界モデル企業が巨額の資金調達を獲得した。国内では世界モデル関連の資金調達案件が20件超も現れ、業界では世界モデルがAIの次の10年における重要な追い風になるのではないかと、口々に語られている。

複数のAI分野の起業家は、证券时报の記者に対し、世界モデルはAIが物理世界を理解し、相互にやり取りできるようにしてこそ、AGIの実現への必経の道になると述べた。現時点の世界モデルの発展はまだ黎明期であり、誰が物理とインタラクションのデータ・フライホイールをいち早く回し始められるか、誰が発展の先行機をつかめるかが勝負だ。

AIを現実世界に根づかせる必要

OpenAIは近日、動画生成アプリSoraを閉鎖し、戦略の方向性を調整した。これ以降、Soraチームは世界モデル研究に注力する。

AIが現実を生成することをやめ、代わりにAIが現実を理解するようにする。OpenAIの決定は、業界における次の戦略的な高地を映し出している。それは世界モデルだ。復旦大学などの高等教育機関による解説によれば、世界モデルは、感覚データから運動、力、空間関係といった動的な特性を学習し予測することで、物理世界における事物の性質、運行の法則、空間特性を理解する。世界モデルを用いることで、AIは認知・認識から理解・推論へと移行でき、身体性のあるインテリジェンスと、客観的な環境における自律的かつ高効率なインタラクションの基盤となる。

復旦大学管理学院の院長補佐で、情報管理・ビジネスインテリジェンス学科の学科長を務める張誠は、证券时报の記者へのインタビューで次のように述べた。AIの「思考」の本質は、データ統計に基づく確率予測であり、本当の感情や世界への深い認知が欠けている。問題の根源は、モデルが主に言語データの上に構築されている点にある。モデルがテキストだけで世界を学習する場合、その認知の境界もまた、言語が表現できる範囲に制限されてしまう。一方で世界モデルは、視覚、聴覚、空間のダイナミクスなどのマルチモーダルな情報によってシステムが環境の運行法則を描写できるようにする。

KPMG中国の自動車業界における華東・華西地区の監査担当パートナーである苗桢は、证券时报の記者へのインタビューで、世界モデルの中核的価値は物理法則に合致する仮想のパラレルワールドを構築し、それを通じて環境空間の理解や長期の時系列推論による予測出力、意思決定を行い、シーン推論、因果予測、ロングテール・シーンのカバーを実現し、純粋なデータ駆動モデルの、極端に長いテール・シーンに対する汎化能力不足という弱点を補うことにあると述べた。

世界モデルがなければ、ロボットの上限は受動的にコードを実行する高度な自動化ツールにとどまる可能性が高い。クーウォー科技の創業者兼CEOである何弢は、证券时报の記者に対し、同社の清掃ロボットが都市のシーンで実装する際の具体的な難題を挙げた。ロボットは標準的な壁に遭遇すれば回避できるが、折れかけの枝や不規則に積み上がったものに近づくと、事前に設定されたコードにそのような物体の定義がないため、システムが通行不可能な障害物だと判断し、その場で稼働を停止してしまう。「もし世界モデルがあれば、システムは素材や物理特性に基づいて予測し、迂回の軌跡を計画し、さらには安全を前提に物体を軽く押し通して、連続稼働を維持できる。」

世界モデルの資金調達パーティーが盛況

世界モデルの見通しと潜在力を踏まえ、国内外の資本はすでに大量に投資を投下している。今年2月、李飛飛が創業した世界モデル企業は10億ドルの資金調達を完了した。間もなく、楊立昆の世界モデルのスタートアップ企業AMIも10億ドル超の調達を完了した。

国内では、企查查が提供するデータによると、今年に入って国内で世界モデル関連の資金調達案件が25件発生し、調達総額は22億元超だった。そのうち、極佳視界が3月に10億元のPre-Bラウンド資金調達完了を宣言し、同月に、その身体性のある世界モデルGigaWorld-1がWorldArenaの首位に登り詰めたことを発表した。

「世界モデルの『資金調達ラッシュ』は、業界の共通認識が形成されつつあることを示している。AIがデジタル世界から物理世界へ向かうのが次の主戦場だ。」擎朗智能の関連責任者は、证券时报の記者へのインタビューでそう述べた。過去10年、AI能力の飛躍は主に知覚と言語の層で起きてきた。しかし物理世界に本当に入るには、物理世界の運行法則、つまり空間関係、因果関係、物理属性を理解しなければならない。

上記の責任者は、資本が世界モデルに賭ける本質は、物理AIという1兆級の巨大なレースコースに賭けていることだと述べた。将来の技術ルートは、大統合から専門分業へと移行する可能性がある。世界モデルが物理の直観を担い、視覚—言語—動作モデル(VLA)が意味理解を担い、ボトムレベルの制御が精密な実行を担う。分業が明確になれば、資本もより正確な参入ポイントを見つけられる。

何弢は证券时报の記者に対し、2026年以降に世界モデルを対象とした密集した高額資金調達が行われていることは、資本と技術界が「大規模言語モデルの次の到達点は物理世界である」という判断で一致していることを示している。世界モデルは物理AIへの必経の道であり、身体性のあるインテリジェンスにおける「ChatGPTの瞬間」がまもなく訪れるところだ。今後の世界モデル業界の競争においては、規模化された物理データの入口を掌握し、ビジネス上のクローズドループを実現できる企業だけが、この技術革命を主導できる。

ロボットを「人」により近づけられる

ここ数年、大規模言語モデルを基盤としたデジタルAGIがデジタル世界を作り替えた。世界のGDPのうち約半分は物理世界にある一方で、物理AGIの成長余地はまだ無限に近い。物理AGIが飛躍するための土台は、世界モデルにある。これまでの端から端までのモデルと垂直領域モデルの技術的蓄積およびデータの沈殿を踏まえ、本年は複数のAI企業が業務の支点を世界モデルへと切り替えた。

クーウォー科技は2月にCoowa WAM 2.0汎用世界モデルを発表した。何弢は、取材に対し、この世界モデルの提供は、身体性インテリジェンス業界に広く存在する「汎化能力の欠如」と「産業発展の上限」という問題を解決するためだと述べた。従来は業界の多くがルール駆動、または単一シーンに依存した端から端までのモデルに頼っていた。WAM 2.0モデルは、多形態の物理AIエンティティに、複雑な物理世界に対する常識的理解、幾何推論、因果予測の能力を与える。

大規模言語モデルがインターネット上のテキストというデータ・フライホイールに依存するのと同様に、世界モデルの反復もまた、実世界で物理終端が生み出す高価値なインタラクションデータに依存している。何弢は、同社はWAM 2.0モデルを搭載した「シティ・コンシェルジュ」系のロボットを、都市の街路へ直接投入し、定常的な作業として行わせる計画だと説明した。商業収益を生み出しながらも、継続的に高品質な物理世界データを回収し、モデルの反復を後押しする。

擎朗智能はサービスロボット分野のリーディング企業であり、商用サービスロボットの出荷台数シェアは世界一だ。同社は昨年、サービス業界向けの世界初のVLAモデルKOM2.0を発表した。

擎朗智能の関連責任者は、近日证券时报の記者に対し、同社はVLAモデルと世界モデルの融合を積極的に模索していると明かした。VLAモデルの短所は、物理世界に対する因果理解が欠けているため、動作がもたらす物理的な結果を予測しづらい点にある。世界モデルは「少数サンプル学習」や「ゼロサンプル汎化」への道の鍵であり、ロボットが「頭の中」で動作の結果をシミュレーションし、最適な戦略を選択できるようにする。

「世界モデルは、人と機械の安全な相互作用を実現するための基盤でもある。サービスの場面では、ロボットは行動の結果を予測する必要がある。たとえば物を渡すときの力が強すぎないか、などだ。世界モデルがなければ、ロボットはこれらの因果の連鎖を本当に理解することができない。」上記の責任者は、「今年、当社は一部の場面で世界モデルの予測能力を試験導入し、ロボットの環境への適応性と安全性を高める」と述べた。

工業シーンに焦点を当て、「ブルーカラー・ロボット」の研究開発を手がける上海開普勒机器人有限公司(以下「開普勒」)も、工業向け世界モデルと家庭向け世界モデルの構築を始めている。開普勒のチーフテクノロジーオフィサーである席奥は、证券时报の記者へのインタビューで、同社はまず工業世界モデルを工業VLAと融合させ、その効果を小規模なPOC(実現可能性検証)で確認し、将来の大規模導入のための基礎を築く計画だと述べた。

データの壁が、世界モデルの競争力を左右するかもしれない

過去1年は「身体性インテリジェンス元年」と呼ばれた。ロボットが「華麗に見えるが中身が薄い」状態のまま出てきた一方で、十分に賢くないという痛点も露呈した。より多くの企業が世界モデルへの布陣を進めるにつれ、業界関係者は2026年が世界モデルがAGIの基盤を築く元年になるのではないかと直言することもある。エヌビディアのロボティクス責任者Jim Fanは今年、2026年が大規模世界モデルがロボット、そしてより広義のマルチモーダルAIのために真に基盤を築く最初の年になると記事を投稿した。

見通しは広く、進化の速度も速いとはいえ、世界モデルのレースコースはまだ初期段階にあり、業界では統一され成熟した技術パラダイムはまだ形成されていない。加えて業界を最も不安にさせているのは、高品質な物理世界データの希少性であり、それが世界モデルの普及を大きく制約している点だ。

何弢は、世界モデルの進化は身体性インテリジェンス産業の3つの主要段階と強く結びつくと述べた。すなわち、現在の垂直型インテリジェンスの転換から始まり、今後2年間の場面化された協調作業、そして3〜5年後の家庭シーンの普及へと至る。現時点の業界は、第一段階から第二段階への移行という重要な局面にある。今段階の主な課題は、高品質で、マルチモーダルな、真に物理世界でのインタラクションデータが極端に不足していることだ。

「操作データはインターネット上の動画データやコンピュータ・シミュレーションデータに完全に依存できない。つまり、温室の中では真の世界モデルは育たないし、クラウド上のシミュレーションデータだけでは、物理世界の尽きない長いテール問題を解決できないのだ。」何弢はそう述べた。

擎朗智能の関連責任者は、短期的にはVLAが強化学習と組み合わせることで、多くの実際の問題をすでに解決できると記者に伝えた。しかし身体性インテリジェンスの中期の発展という観点では、ロボットがより開かれた、より複雑な環境(家庭、公共の場など)に入っていくにつれて、世界モデル能力のないシステムは汎化のボトルネックに直面することになる。その時点で世界モデル能力を備えたプレイヤーが世代間の優位性を形成する。長期的には、世界モデルは汎用ロボットに必須の能力となるだろう。

「データの壁が形成されつつあり、先行優位が極めて重要だ。高品質な物理データの取得と、規範に沿った利用がコアとなる課題である。」上記の責任者は強調した。資本が賭けているのは、企業が「データ—モデル—シーン」というフライホイールを回し通せるかどうかだ。企業が実際のシーンでいち早くスケール化した展開を完了できれば、先行優位を形成できる。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン