暗号資産を購入

支払い方法

USD

購入 & 売却

Visa、Mastercard、SEPAなどに対応

柔軟な取引、手数料ゼロ

暗号資産を使って世界中で支払いができます

基礎

暗号を自由に取引

証拠金取引

レバレッジを使って利益を拡大しましょう

即時スワップと自動投資

手数料ゼロ＆スリッページなしで、どんなサイズでも取引可能

レバレッジポジションを簡単に利用

上場前取引

上場前の新規トークンを取引

上級

Gateウォレットでオンチェーン取引を行う

新しいオンチェーントークンにスマートアクセス

自動取引によるスマート戦略

専門家の取引戦略をフォロー

プラットフォーム間で共有される 1 つの証拠金残高

数百の無期限先物にアクセス

世界の伝統資産を一つのプラットフォームで

オプション取引

ヨーロッパ式のバニラオプションで取引できます

資本効率の最大化

先物取引の紹介

先物取引の準備をする

先物イベント

イベントに参加して報酬を獲得

仮想資金を使ってリスクのない取引を体験しよう。

米国株CFDデリバティブ

実際の米国株とETFにアクセス

優良な香港上場株式の取引

韓国の現物株と人気資産を取引

高レバレッジ・24時間365日取引

トークン化株式

実際の株式資産に裏付けられています

世界中の株式IPOにフルアクセス

米国債RWA利回り向けにGUSDをミント

人気株式を取引して、豊富なエアドロップをアンロックしましょう

ローンチパッド

キャンディーを集めてAirDropを獲得

クイックステーキング潜在的な新しいトークンを獲得しよう

GTを保有して、大量のAirDropを無料で入手

世界中の株式IPOにフルアクセス

Alphaポイント

オンチェーン資産を取引してAirdropを獲得

先物ポイント

先物ポイントを獲得し、Airdrop報酬を受け取りましょう。

投資

遊休トークンで利息を稼ぐ

定期的に自動投資

デュアル投資

市場のボラティリティから利益を得る

ソフトステーキング

フレキシブルステーキングで報酬を獲得します

暗号資産ローン

1つの暗号通貨を担保に別の暗号通貨を借りる

レンディングセンター

ワンストップレンディングハブ

VIPウェルスハブ

プレミアム資産成長プラン

金融の未来を自らの手に

クオンツ資金

トップレベルのクオンツ戦略

ステーキング

暗号をステーキングしてPoS製品で稼ぐ

スマートレバレッジ

清算なしレバレッジ

ロックなし、いつでも取引・出金

暗号資産の価値を発見しよう

暗号資産相場分析ライブ

暗号資産トレーダーと意見交換

暗号資産業界の最新情報

もっと

プロモーション

イベントセンター

アクティビティに参加して報酬を獲得

友達を招待して紹介報酬を獲得

アフィリエイトプログラム

限定コミッション報酬を獲得

影響力を高めてAirdropを獲得

アナウンスメント

プラットフォームのリアルタイム更新

暗号資産の洞察を得よう

VIPサービス

大幅な手数料割引

ワンストップ資産管理ソリューション

機関向けサービス

エンタープライズ向け資産ソリューション

開発者（API）

Gateアプリケーションエコシステムに接続する

OTC銀行送金

法定通貨の入金と出金

ブローカープログラム

豊富なAPIリベートメカニズム

AI

あなたの対話型AI万能パートナー

ソーシャルアプリで Gate AI をそのまま利用

Gateブルーロブスター、すぐに使える

Gate for AI Agent

AIインフラストラクチャ、Gate MCP、Skills、CLI

Gate Skills Hub

1万以上のスキル

オフィス業務から取引まで、AIをもっと活用できるワンストップスキルライブラリ

その他

ヘルプセンター

FAQ とヘルプガイドを見つける

暗号投資について学ぶ

パートナー

チャンピオンと共に成長

準備金証明

Gate は100%準備金証明を約束します

あなたの資産を安全に保護します

具身知能のスキルタイム！NVIDIAがロボットスキルライブラリをオープンソース化、Jim Fan：パラダイムが変わった

SnapshotLaborer

2026-07-01 09:54:20

6！ロボットもスキルを学べるようになった。

先ほど、NVIDIAがロボットを継続的に成長させるスキルライブラリを発表した——

ASPIRE。

簡単に言うと、ASPIREはロボット版のCoding Agentのようなものだ。

GPTがあなたのプロンプトや作業記録を再利用可能なスキルに変換するように、ASPIREもロボットの失敗や修復の経験を、後で呼び出せる知見として蓄積する。

ただし、レビューするのはコードではなく、ロボットの操作プロセスだ。

ロボットがタスクを実行するたびに、ASPIREは知覚、ナビゲーション、把持、衝突、動作計画などのプロセスをすべて記録する。

その背後で呼び出されるGPT/Claudeは、研究者のようにタスクの問題箇所を判断し、プログラムを反復改良する。成功すれば、その経験をスキルとして書き込む。

こうしてロボットは、コードの記述、実行軌跡の確認、プログラムの修正、スキルの蓄積を通じて継続的に学習できる。

そして、これは単にロボットの経験からスキルを抽出するだけではない。

NVIDIAのロボティクス部門責任者Jim Fan氏は、ASPIREがまったく新しい継続学習のパラダイムを表していると述べている。

その中で：

訓練は、勾配降下法からスキルの洗練（Skill Refinement）へと変化した。
訓練されたモデルは、もはや単なる浮動小数点の重みではなく、拡張し続けるロボットスキルライブラリ（Sensorimotor Skills）に対応する。
分散訓練は、複数のエージェントがそれぞれ異なるスキルを練習し、その経験を1つのスキルライブラリに集約する形となる。

訓練の成果は、必ずしも重みとは限らない

冒頭でだいたい説明したが、ロボットの訓練パラダイムをどう革新するかを詳しく述べる前に、背景を少し説明しておく。

ASPIREの正式名称はAgentic Skill Programming through Iterative Robot Exploration。

これによりロボットはコードでタスクを実行し、失敗した場合はマルチモーダルな実行軌跡を確認してプログラムを修正し、修正した経験を増え続けるスキルライブラリに保存する。

ここでのスキルは、本質的には大規模言語モデルに与えるコンテキストの一部だが、検証済みのコード修正パターン（Code Repair Pattern）を蓄積しており、特定の種類の問題に遭遇した際にロボットが制御プログラムをどのように修正すべきかを示す。

例えば、ロボットがラジオを掴もうとしたとき、目標を認識しているにもかかわらず近づけない場合。

エージェントは、認識の誤りではなく、プランナーが指定した目標点がすべて障害物の衝突緩衝領域内にあると分析できる。

これにより、ASPIREはこの経験に基づいて新しいスキルをまとめる：

このような計画の失敗に遭遇した場合、45°、90°、180°などの異なる角度から目標に再接近し、衝突のない経路が見つかるまで試みる。

以後、同様のシナリオでは、目標がラジオであれ電子レンジであれ他の家具であれ、この経験を直接再利用でき、再試行の必要がない。

ここで疑問に思うかもしれない。ロボットの訓練といえば、データ収集、勾配降下法、モデル重み、実機データ収集、シミュレーションから現実への転移ではないのか？

なぜ突然スキルを蓄積することになったのか？

まず、最近注目されているパラダイムであるCode as Policyについて説明する必要がある。

VLAなどのエンドツーエンドのポリシーモデルとは異なり、Code as Policyはモデルにロボットの動作を直接出力させるのではなく、大規模言語モデルに実行可能なロボット制御プログラムを記述させる。

プログラム内では、知覚モジュール、計画API、制御プリミティブ（物体認識、経路計画、アーム移動、把持実行など）を呼び出すことができる。

これにより、ロボットの振る舞いはもはやニューラルネットワークの重みに完全に隠されるのではなく、実行可能な操作コードとなる。

コードがあれば、現在非常に強力なエージェントモデルによる検査、修正、デバッグ、最適化が可能になる。

しかし、これまでのCode as Policyには2つの問題があった。

第一に、ロボットが失敗しても、システムは通常「タスクが完了しなかった」ことしか知らず、知覚の誤りか、把持の失敗か、経路計画の衝突か、回復動作の問題かがわからない。

第二に、そしてより重要なのは、記憶を持たないことだ。

タスクが完了すると、デバッグ中に発見された修正方法、回復戦略、プロンプトの書き方は失われ、次に同様の問題に遭遇した際に最初からやり直さなければならない。

これこそが、Jim Fan氏が次のように述べた理由だ：

（ASPIREがあれば）ロボットが100番目のタスクを完了するとき、もはや1番目のタスクを完了したときのように何も知らない状態ではない。

要するに、このプロセス全体は人間のロボットエンジニアと同じだ：

ロボットプログラムが失敗すると、エンジニアは実行プロセスを再生し、知覚結果を確認し、動作軌跡を分析し、把持の誤りか、計画の誤りか、回復動作の接続の問題かを判断する。

修正後、エンジニアは今回の経験を記録する。次に机の端の物体、引き出しの取っ手、狭い空間のナビゲーションなどに遭遇したとき、ゼロから始める必要はない。

ASPIREが行うのは、この経験蓄積メカニズムをエージェントに委ねることだ。大規模言語モデルにロボットコードを書かせるだけでなく、実行環境で繰り返し試行し、繰り返し確認し、繰り返し修正させ、最終的に検証済みの修正経験をスキルとして蓄積させる。

したがって、ASPIREでは訓練はもはや勾配降下法だけではない。

訓練プロセスはスキルの洗練（Skill Refinement）となり、訓練の成果物もモデルの重みだけでなく、ロボットが蓄積し成長し続けるスキルライブラリとなる。

3段階のパイプライン

論文では、この考え方は3段階のパイプラインとして実装されている。

まずはrobot execution engine、つまりロボット実行エンジン。

従来のロボットプログラムが失敗すると、システムは単にタスクが完了しなかったとだけ通知するかもしれない。

ASPIREは失敗を分解し、各知覚、計画、把持、制御呼び出しの入力、出力、視覚的証拠、エラーログを残す。

人間のエンジニアがロボットを調整する際にビデオを再生し、軌跡を確認し、知覚の誤りか把持のクラッシュかを調べるように、ASPIREはこの一連の動作をコーディングエージェントに委ねる。

次にskill library。エージェントがプログラムを修正した後、その経験を捨てずに、再利用可能な知識として抽出する。

公式のスキルライブラリには、SAM3テキストプロンプトの書き方、机の端の物体への多角的アプローチ、引き出しの取っ手の誤検出フィルタリング、平面物体を押す際の動作プリミティブなど、具体的な項目が掲載されている。

これらは従来のモデル重みとは異なり、ロボットプログラマーの失敗ノートのようなものだ。

最後にevolutionary search。

エージェントは単一の修正経路をたどるだけでなく、システムは複数の候補制御プログラムを生成し、実行環境で実行させ、生き残ったプログラムと失敗した軌跡に基づいて反復する。

ソフトウェア工学では、コーディングエージェントはコードを書き、テストを実行し、トレースを確認し、バグを修正することに慣れている。ASPIREが行うことは、このサイクルを物理世界に移すことだ。

実験による検証

この方法を検証するため、論文では3つの古典的なロボット工学ベンチマークでテストを行った。LIBERO-Pro、Robosuite、BEHAVIOR-1Kであり、それぞれ汎用操作、接触密集型操作、長時間の家庭内タスクをカバーしている。

全体的な結果は、従来のCode as Policy手法よりも明らかに優れていた。

例えば、Robosuiteの両腕物体受け渡し（Bimanual Handover）タスクでは、ASPIREは成功率を20%から92%に向上させた。

また、汎化能力に関して。

研究ではまずLIBERO-90でスキルライブラリを蓄積し、その後、見たことのないLIBERO-Pro Longの長タスクに直接転移させた。その際、新しいタスクに対する追加訓練やスキルライブラリの更新は行わなかった。

結果は、スキルライブラリが豊富になるにつれて、ロボットの新しいタスクでの成功率も向上し、ほとんどできない状態から最終的に31%に達した。つまり、スキルライブラリが厚ければ厚いほど、ロボットは初心者のようではなくなる。

著者紹介

技術ブログの最後に、NVIDIAは完全な著者リストも公開した。

依然としてGEARチームの常連メンバー：Jim Fan、朱玉可、Guanzhi Wang、石冠亚など。

先頭に並ぶ3人の著者は共同貢献者である。

そのうち、Runyu Lu氏は現在ミシガン大学の博士課程2年生で、GEARでインターン中。Yuubo Wu氏はイリノイ大学アーバナ・シャンペーン校（UIUC）、Ethan Kou氏はカリフォルニア大学バークレー校出身で、現在は学部生である。

ちなみに、昨日NVIDIAは国内のロボットチームの採用拡大も発表し、北京、上海、深圳の3都市で多くのポジションを公開した。具身知能、シミュレーション、ロボット展開、ソリューションアーキテクチャなどの分野をカバーしている。

本稿の出典：量子位

リスク警告および免責条項

        市場にはリスクが伴い、投資には注意が必要です。本稿は個人の投資アドバイスを構成するものではなく、個々のユーザーの特別な投資目標、財務状況、ニーズも考慮していません。ユーザーは本稿の意見、見解、結論が自身の状況に適合するかを検討する必要があります。これに基づく投資は自己責任で行ってください。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
リポスト
共有

コメント

コメントを追加

コメントを追加

コメントなし

人気の話題
もっと見る
#
GateCompletesDividendDistribution
132.91K 人気度
#
StrategyBuybackSurges12%
1.11M 人気度
#
IsraelStrikesIranBTCPlunges
67.27K 人気度
#
PredictWorldCupShare20000U
562.61K 人気度
#
TrumpDisclosesOver100MBTCETH
3.83M 人気度

ピン留め

サイトマップ