ME News メッセージ、4 月 8 日(UTC+8)、最近、Yann LeCun チームは、多時間スケールの潜在世界モデルに基づく階層的計画手法を提案しました。これは、学習型世界モデルが長時間制御において直面する予測誤差の蓄積と探索空間の指数関数的増大という二つの課題を解決することを目的としています。この方法は、異なる時間スケールで潜在世界モデルを学習し、スケールを超えた階層的計画を実行することで、長時間推論を実現するとともに、推論時の計画の複雑さを著しく低減します。このフレームワークはプラグイン式の抽象モジュールとして機能し、多様な潜在世界モデルのアーキテクチャや分野に適用可能です。実験では、実世界の非貪欲ロボットタスク(例:掴む・放す)において、最終目標のみを与えた場合、階層的計画は70%の成功率を達成し、一方で単層の世界モデルは成功率0%でした。物理に基づくシミュレーション環境(例:押し操作や迷路ナビゲーション)では、階層的計画はより高い成功率を得るとともに、必要な計画時間の計算量を最大3倍削減しました。この手法は、タスク固有の報酬や外部から提供されるサブゴールに依存せず、未見の環境やタスクにおいても強力な汎化能力を示しています。(出典:InFoQ)
Yann LeCunチームは階層的計画手法を提案し、JEPA世界モデルの長期推論能力を向上させた
ME News メッセージ、4 月 8 日(UTC+8)、最近、Yann LeCun チームは、多時間スケールの潜在世界モデルに基づく階層的計画手法を提案しました。これは、学習型世界モデルが長時間制御において直面する予測誤差の蓄積と探索空間の指数関数的増大という二つの課題を解決することを目的としています。この方法は、異なる時間スケールで潜在世界モデルを学習し、スケールを超えた階層的計画を実行することで、長時間推論を実現するとともに、推論時の計画の複雑さを著しく低減します。このフレームワークはプラグイン式の抽象モジュールとして機能し、多様な潜在世界モデルのアーキテクチャや分野に適用可能です。実験では、実世界の非貪欲ロボットタスク(例:掴む・放す)において、最終目標のみを与えた場合、階層的計画は70%の成功率を達成し、一方で単層の世界モデルは成功率0%でした。物理に基づくシミュレーション環境(例:押し操作や迷路ナビゲーション)では、階層的計画はより高い成功率を得るとともに、必要な計画時間の計算量を最大3倍削減しました。この手法は、タスク固有の報酬や外部から提供されるサブゴールに依存せず、未見の環境やタスクにおいても強力な汎化能力を示しています。(出典:InFoQ)