MEニュースのメッセージ。4月1日(UTC+8)、Michael Psenkaが投稿し、Yann LeCunがリポストした新しい世界モデル・プランナー「GRASP」コードがオープンソース化された。GRASPは、世界モデルを学習するための並列確率的勾配プランナーであり、その中核となる考え方は、強化された軌道空間において行動と中間の「仮想」状態を同時に最適化することにある。学習した動的モデルと整合するために、ダイナミクス整合性ペナルティによって一致を担保し、効率的な並列化による計画を実現する。主要な設計には、並列計算可能な仮想状態の導入、ノイズによる状態空間の探索、停止勾配技術によって勾配が高次元の視覚モデルの状態入力へ流れ込むのを防ぐこと、そして目標形成と周期的なシリアル展開の同期ステップを組み合わせて安定性を確保することが含まれる。このプランナーはDINO-WMプロジェクトの上に構築されているが、アダプターを通じて他の世界モデル(LeWorldModel、JEPA-WMsなど)とも統合でき、PushT、TwoRoomなど多様な環境に適用可能だ。コードベースには中核となるアルゴリズム実装と、アダプターのインストール用スクリプトが提供されている。(出典:InFoQ)
Yann LeCunがリツイートした世界モデルプランナーGRASPのコードがオープンソースになりました
MEニュースのメッセージ。4月1日(UTC+8)、Michael Psenkaが投稿し、Yann LeCunがリポストした新しい世界モデル・プランナー「GRASP」コードがオープンソース化された。GRASPは、世界モデルを学習するための並列確率的勾配プランナーであり、その中核となる考え方は、強化された軌道空間において行動と中間の「仮想」状態を同時に最適化することにある。学習した動的モデルと整合するために、ダイナミクス整合性ペナルティによって一致を担保し、効率的な並列化による計画を実現する。主要な設計には、並列計算可能な仮想状態の導入、ノイズによる状態空間の探索、停止勾配技術によって勾配が高次元の視覚モデルの状態入力へ流れ込むのを防ぐこと、そして目標形成と周期的なシリアル展開の同期ステップを組み合わせて安定性を確保することが含まれる。このプランナーはDINO-WMプロジェクトの上に構築されているが、アダプターを通じて他の世界モデル(LeWorldModel、JEPA-WMsなど)とも統合でき、PushT、TwoRoomなど多様な環境に適用可能だ。コードベースには中核となるアルゴリズム実装と、アダプターのインストール用スクリプトが提供されている。(出典:InFoQ)