ロボット開発において、Sim to Real(シミュレーションから現実へ)のギャップは、常に最大の難題の一つです。たとえAIアルゴリズムがシミュレーションモデル上では良好に振る舞っていても、現実の複雑な環境では失敗する可能性があります。高性能推論プラットフォームであるエヌビディアJetson Thorは、すでに複数の企業がロボット用途に使用しています。一方で、テキサス・インスツルメンツの制御・センシングモジュールは、このプラットフォームに物理世界と直接やり取りする能力を追加します。両者の組み合わせにより、開発者はシステムの認識、動作、安全性をより早く、より正確に検証できるようになり、有効にプロトタイプ検証の期間を短縮し、反復コストを引き下げることができます。
人型ロボットの新章! デバイス企業の德州仪器TXN.US(と英伟达NVDA.US)がAIとセンサーを融合し、「物理AI」革命に火をつける
アナログ半導体と組み込み処理ソリューションの半導体大手――長年「世界の半導体需要の天候・温度計」と呼ばれてきたテキサス・インスツルメンツ(TXN.US)は、そのリアルタイム制御、センシング、電源の製品群を「世界最高の時価総額企業」とされるエヌビディア(NVDA.US)の先進的なロボット向け計算コンポーネント、イーサネット・アーキテクチャに基づくセンサ、そして独自のシミュレーション技術と全面的に組み合わせ、開発者に大きな技術サポートを提供することで、人型ロボットなどと呼ばれる「フィジカルAI(Physical AI)」の端末デバイスを大規模に構築・導入・量産するのを支援しています。
直近のメディア報道によると、アナログ半導体の覇者であるテキサス・インスツルメンツとエヌビディアの協業は、人型ロボットの知能システムをより高い段階へ押し上げることが期待されており、単に「手を組んでロボットを作る」といった表層的なものではありません。今回の最新協業は、底層の技術スタック上で、より完成度が高く、より安全で、よりスケールしやすいロボット知能の基盤インフラを構築することに近いものです。これは業界が人型ロボットの商用化を推進するうえで、実質的な後押しになります。
市場の「大量のAI推論ワークロード」と「実体での実行」を結びつけたいという期待が引き続き高まる中、エヌビディアとテキサス・インスツルメンツの協業は、チップとセンシング層の単なる積み重ねではなく、AI推論からリアルタイムの認識、そして下層の制御システムまでを横断して協調的に構築することです。人型ロボットが実世界のアプリケーションを実現するための重要な基盤を押し進めるものになっています。
テキサス・インスツルメンツの産業オートメーション&ロボティクス部門総支配人、ジョヴァンニ・カンパネッラ(Giovanni Campanella)は「テキサス・インスツルメンツの包括的な製品群は、エヌビディアの強力なAI計算能力と実際のアプリケーションの間にあるギャップを埋め、開発者がより早く“類人形”のオペレーティングシステム全体を検証できるようにします」と述べています。さらに声明の中で「この統合アプローチは、製品プロトタイプ/試作品から商用の人型ロボットへの進化を加速させ、これらのロボットが安全に人間と一緒に働けるようにします」とも言及しました。
エヌビディアは最近、「物理AI(Physical AI)」と呼ばれるロボットや自動運転車など、より幅広い領域へ最先端のAI技術を展開することに注力しているといえます。需要の拡大を継続し、データセンター事業以外の新たな成長ポイントを求めるためです。エヌビディアCEOのジェンスン・フアン(黄仁勳)の見解によれば、「物理AI」は、ロボット/自律オペレーティングシステムが実世界で認識し、推論し、一連の行動を完遂できるようにすることを重視しています。そして「物理AI」が人類文明の進化を後押しする時代が到来しようとしています。「物理AI」は、ロボット/自律システムが実世界で認識・推論・行動を行えるようにすることを重視し、この3つの能力こそが、モデルを「会話するだけ」から「物理世界で働ける」へと前進させるための重要なツールチェーンです。
テキサス・インスツルメンツはエヌビディアと協業し、ロボット知能システムにおける最も難しい“基礎層の認識+制御+AI推論”の3層協調に取り組む
今回の協業の一環として、テキサス・インスツルメンツは、センシング融合ソリューションを設計しました。同社のミリ波レーダー技術をエヌビディアのJetson Thorロボット技術と組み合わせ、エヌビディア独自のHoloscanセンサーブリッジを用いて、低遅延の3D認識と安全意識を実現し、人型ロボット技術の発展を支援します。両社のこの最新の開発成果は、3月16日から19日にカリフォルニア州サンノゼで開催される注目のエヌビディアGTCイベントで展示されます。
エヌビディアのロボティクス&エッジAI事業担当副社長ディープ・タラ(Deepu Talla)は「人型ロボットが予測不能な環境で安全に稼働するには、極めて強力な計算・処理能力が必要であり、非常に複雑なAIモデル、リアルタイムのセンサデータ、そしてモータ制御システムを同時に同期させる必要があります」と述べています。
高精細カメラとレーダーデータを融合することで、テキサス・インスツルメンツとエヌビディアの共同ソリューションは、物体検出、位置推定、追跡の技術反復を改善し、同時に誤検知/システムの誤報を減らし、人型ロボットのリアルタイムな意思決定能力を向上させます。
業界のロボット専門家の間では、現段階では真に汎用能力を備えた自律型人型ロボットまでにはなお数年かかるという見方が一般的です。しかし、認識、推論、動作協調といった領域におけるシステムとしての進展は、商用展開に必要な前提条件です。テキサス・インスツルメンツとエヌビディアの協業は、業界を「アルゴリズムとシミュレーション検証」から「実世界での安全な稼働」段階へ移行させるための重要なステップであり、業界全体の開発効率向上、システムの頑健性強化、そして最終的に量産への道のりを短縮することに大いに役立つはずです。
ロボット開発において、Sim to Real(シミュレーションから現実へ)のギャップは、常に最大の難題の一つです。たとえAIアルゴリズムがシミュレーションモデル上では良好に振る舞っていても、現実の複雑な環境では失敗する可能性があります。高性能推論プラットフォームであるエヌビディアJetson Thorは、すでに複数の企業がロボット用途に使用しています。一方で、テキサス・インスツルメンツの制御・センシングモジュールは、このプラットフォームに物理世界と直接やり取りする能力を追加します。両者の組み合わせにより、開発者はシステムの認識、動作、安全性をより早く、より正確に検証できるようになり、有効にプロトタイプ検証の期間を短縮し、反復コストを引き下げることができます。
テキサス・インスツルメンツは、リアルタイム・コントローラ、センシング・センサー(例:ミリ波レーダー mmWave)、および電源管理技術を、エヌビディアの高性能ロボット計算プラットフォーム(Jetson Thor)とHoloscan Sensor Bridgeと統合し、センシングから制御、推論計算までを一つの完全なチェーンとして構成します。従来のように視覚カメラ+GPU推論システムだけに頼るアーキテクチャと比べ、このセンシング融合ソリューションは、低遅延の3D認識と安全意識を実現し、ロボット全体が環境をリアルタイムに理解する能力を高めます。これは、実際に展開できるシステムへ進むための重要な一段です。
人型ロボットがタスクを実行するときには、複雑なAI推論だけでなく、sensor fusion、多関節の運動制御、エッジでの安全意思決定などをリアルタイムで処理する必要があります。これらの機能は、極めて短時間で完了させる必要があります。テキサス・インスツルメンツのミリ波レーダーとイーサネットのブリッジング技術は、ロボットが複雑な環境(たとえばガラスドア、強光/弱光、煙や粉じん)下で、従来のカメラ方式よりも確実に物体を検出・追跡するのに役立ちます。このハードウェアによる認識層の向上は、実運用のための堅固な土台を築きます。
人型ロボットの超大型ブーム
米国に本社を置く複数のテクノロジー企業が、高周波帯の人型ロボットの開発に取り組んでいます。たとえば、マスクが率いる電動車・AI・ロボットのリーダー、テスラ(TSLA.US)は、Optimusと呼ばれる人型ロボットを開発しており、産業用途およびコンシューマー用途での活用を計画しています。
マイクロソフト(MSFT.US)およびOpenAIの支援を受けるFigure AIは、さまざまなタスクを処理できる汎用型の人型ロボットの構築を試みています。Figure AIは「これらのロボットは危険で不快な仕事をなくし、最終的に人類社会がより幸せで有意義な生活を送れるようにすることができます」と述べています。ボストン・ダイナミクス(Boston Dynamics)は、同社のAtlasロボットが「産業の作業環境を根本から変える」ことを明らかに望んでいます。
世界の規模で見れば、テスラのOptimusからFigure AIのHelixスーパーシステム、さらに他のテクノロジー企業の研究開発の取り組みまで、資本と産業がこの細分化された領域に密集投下していることが示されています。現在の業界データは、各種の人型ロボットのプロトタイプが、機能、認識、動作制御の面で顕著な進展を遂げていることを示しています。両足のバランス、環境認識、多モーダルな意思決定といった特性が段階的に成熟し、さらにサプライチェーンのコストや重要コンポーネントの性能が継続的に改善されている一方で、複数の技術ルートが併存する競争局面も出現しています。これらは、コンセプト研究から実際のシーンでのパイロットへの移行を後押ししています。この前向きなダイナミクスは、業界が「ホットな話題の投機(バズ)」の段階から、真の技術の蓄積とスケール展開の段階へ移行しつつあることを示しています。とはいえ大規模普及にはなお時間の窓があります。市場調査機関は、今後10年でこの分野の市場規模が大きく成長する見通しであり、テスラのOptimusのような代表的プロジェクトは、高い信頼性と安全性の目標を実現する計画があり、今後数年で量産計画を推進する予定です。
現時点での人型ロボット開発の中核的な推進力は、AIの認識、意思決定、運動制御の深い融合です。これは、大規模モデルを使って言語と視覚情報を理解し、強化学習の優先度による意思決定を行い、そしてセンサーフュージョン(視覚、レーダー、触覚)を活用することを含みます。この種のシステムは、制御された環境で歩行できるだけでなく、より高次のタスク、例えば物流の荷物搬送、メンテナンスの点検、あるいは人間と協働するサービス作業も実行できます。モルガン・スタンレーなどの機関は、このような総合技術のブレークスルーこそが、商用展開の実現可能性を押し上げる鍵だと考えています。モルガン・スタンレーのアナリストは、人型ロボット市場は最終的に従来の自動車産業を上回ると予想しており、2050年までに、世界の人型ロボット市場の年間売上規模が5兆ドルを超える可能性があると見込んでいます。その時点では、人型ロボットの台数が10億台を超える見込みです。
しかし、カリフォルニア大学バークレー校の教授でロボット専門家のケン・ゴールドバーグ(Ken Goldberg)は、最近の学術誌記事の中で、エンジニアが現実に通用する技能を持つ人型ロボットを製造するには、まだ長い道のりがあると述べています。
ゴールドバーグは「私たちはみんなChatGPTと、そのビジョンや言語面での驚くべき仕事をよく知っていますが、大半の専門研究者はこうした類推に非常に緊張しています。つまり、いま私たちはこれらの問題を解決したので、人型ロボットに関する重大な問題を来年解決することになる、というわけではないのです。私は起きないとは言いませんが、2年、5年、あるいは10年のうちには起きないと言っています。私たちは、泡を生み、最終的に大きな反響につながることを避けるために、期待値をリセットしたいのです」と述べています。