ME News ニュース、4月17日(UTC+8)、研究者は最近、π0.7と呼ばれる新しい汎用ロボット基盤モデルを発表しました。これは、その汎化能力において顕著な突破を達成したとされます。このモデルは、幅広い巧妙な操作タスクを実行でき、そのパフォーマンスは専門的に微調整されたエキスパートモデルとほぼ同等であり、新しい言語指示を理解し、訓練データに見られなかったタスクを完遂します。例えば、新しいキッチン電器を使ったり、訓練されていないロボットに衣服を畳ませたりすることです。π0.7は、すべてのスキルを箱から出してすぐに実行でき、それらを組み合わせて新しいタスクを解決し、異なるロボットプラットフォーム、シナリオ、タスク間で効果的に汎化します。記事の見解によると、汎化を実現する鍵は、異なるロボット、人間、自律戦略からの多様で広範なデータを使用し、提示に多様なコンテキスト情報(タスクのテキスト記述、視覚的サブゴール画像、期待されるセグメント長、制御モードのラベルなど)を追加することで行動の曖昧さを排除し、より広範なデータソースを統合することにあります。(出典:InFoQ)
研究者は汎用ロボット基盤モデルπ0.7を公開し、組み合わせの一般化能力を実現しました
ME News ニュース、4月17日(UTC+8)、研究者は最近、π0.7と呼ばれる新しい汎用ロボット基盤モデルを発表しました。これは、その汎化能力において顕著な突破を達成したとされます。このモデルは、幅広い巧妙な操作タスクを実行でき、そのパフォーマンスは専門的に微調整されたエキスパートモデルとほぼ同等であり、新しい言語指示を理解し、訓練データに見られなかったタスクを完遂します。例えば、新しいキッチン電器を使ったり、訓練されていないロボットに衣服を畳ませたりすることです。π0.7は、すべてのスキルを箱から出してすぐに実行でき、それらを組み合わせて新しいタスクを解決し、異なるロボットプラットフォーム、シナリオ、タスク間で効果的に汎化します。記事の見解によると、汎化を実現する鍵は、異なるロボット、人間、自律戦略からの多様で広範なデータを使用し、提示に多様なコンテキスト情報(タスクのテキスト記述、視覚的サブゴール画像、期待されるセグメント長、制御モードのラベルなど)を追加することで行動の曖昧さを排除し、より広範なデータソースを統合することにあります。(出典:InFoQ)