! [DePINと身体性知能の技術的課題と将来](https://img.gateio.im/social/moments-f679cc0130ed1b95329ec5a82763cffb)2月27日、Messariは、FrodoBot Labの共同創設者であるMichael Cho氏とともに、「Building Decentralized Physical AI」に関するポッドキャストを主催しました。 彼らは、ロボティクスにおける分散型物理インフラストラクチャネットワーク(DePIN)の課題と機会について話し合いました。 この分野はまだ初期段階にありますが、現実世界でのAIボットの動作方法に革命を起こす大きな可能性を秘めています。 しかし、大量のインターネットデータに依存する従来のAIとは異なり、DePINロボティクスAIテクノロジーは、データ収集、ハードウェアの制限、評価のボトルネック、経済モデルの持続可能性など、より複雑な問題に直面しています。今日の記事では、この議論の要点を分析し、DePINロボティクスが直面した問題、分散型ボットのスケーリングに対する主な障壁は何か、そしてDePINが中央集権的な方法よりも有利である理由を見ていきます。 最後に、DePINロボティクスの未来を探り、DePINロボティクスの「ChatGPTモーメント」の瀬戸際にいるかどうかを確認します。## DePINインテリジェントロボットのボトルネックはどこにあるのか?Michael Cho 氏が FrodoBot の開発に着手したとき、最大の悩みの種はロボット工学のコストでした。 市場に出回っている商用ロボットの価格は途方もなく高く、現実の世界でAIアプリケーションを宣伝することは困難です。 彼の最初の解決策は、既存のほとんどのプロジェクトよりも安い価格で勝つことを意図して、わずか500ドルの低コストの自律型ロボットを構築することでした。しかし、彼と彼のチームがより深く取り組むにつれて、Michael はコストが実際にはボトルネックではないことに気付きました。 ロボティクスにおける分散型物理インフラストラクチャネットワーク(DePIN)の課題は、「高価かどうか」よりもはるかに複雑です。 FrodoBotLabが進歩し続けるにつれて、DePINロボティクスの複数のボトルネックが浮上しています。 大規模な展開を実現するには、以下のボトルネックを克服する必要があります。### ボトルネック 1: データ大量のインターネットデータでトレーニングされた大規模な「オンライン」AIモデルとは異なり、具体化されたAI(AI)は、知能を開発するために現実世界との相互作用を必要とします。 問題は、世界にはそのような大規模な基盤がなく、このデータをどのように収集するかについてのコンセンサスがないことです。 エンボディド AI のデータ収集は、次の 3 つの大きなカテゴリに分類できます。▎1つ目は、人間がロボットを手作業で制御した際に発生するデータである「人の操作データ」です。 このタイプのデータは高品質で、ビデオストリームとモーションタグ、つまり人間が見ているものとそれに応じてどのように反応するかをキャプチャします。 これは、人間の行動を模倣するようにAIをトレーニングする最も効果的な方法ですが、コストと労力がかかるという欠点があります。▎2つ目のタイプは**合成データ**(シミュレーションデータ)で、荒れた地面を歩くようにロボットを訓練するなど、複雑な地形を移動するロボットの訓練に非常に役立ち、一部の専門分野で非常に役立ちます。 しかし、料理など、最も多様なタスクでは、環境をシミュレートすることはあまり良くありません。 ロボットに目玉焼きを訓練する状況を想像すると、鍋の種類、油温、部屋の状況のわずかな変化が結果に影響を与える可能性があり、仮想環境ですべてのシーンをカバーすることは困難です。▎3つ目のカテゴリーは、現実世界の映像を観察してAIモデルに学習させる「動画学習」です。 このアプローチは可能性を秘めていますが、インテリジェンスに必要な実際の物理的で直接的なインタラクティブなフィードバックが欠けています。### ボトルネック2:自律性のレベルMichael氏は、FrodoBotを現実の世界で最初にテストしたとき、主にラストマイルの配送にロボットを使用していたと述べています。 統計的には、ロボットは配達タスクの90%を無事に完了しました。 しかし、実生活での10%の失敗率は受け入れられません。 10回分娩するごとに失敗するロボットは、単に商業的ではありません。 自動運転技術と同様に、自動運転は10,000回の運転を成功させる記録を持つことができますが、1回の失敗で商用消費者の信頼を損なうのに十分です。したがって、ロボティクスが真に有用であるためには、成功率が99.99%に近いか、それ以上である必要があります。 しかし、問題は、精度が0.001%向上するごとに、指数関数的な時間と労力がかかることです。 多くの人は、この最後のステップの難しさを過小評価しています。マイケルは、2015年にGoogleの自動運転車のプロトタイプに座ったとき、完全自動運転が現実のものになる寸前だと感じたと振り返ります。 あれから10年が経った今でも、レベル5がいつ完全に自律的になるかは議論中です。 ロボット工学の進歩は直線的ではなく、指数関数的なものであり、一歩前進するごとに、その難易度は劇的に上昇します。 この最後の1%の正解率を達成するには、数年または数十年かかる場合があります。### ボトルネック3:ハードウェア:AIだけではロボットの問題は解決できない一歩下がって考えると、最高のAIモデルがあっても、既存のロボットハードウェアは真の自律性を実現する準備ができていません。 例えば、ハードウェアで最も見落とされがちな問題は、触覚センサーの欠如であり、Meta AIの研究など、現在の最高のテクノロジーは、人間の指先の感度には遠く及びません。 人間は視覚と触覚で世界と対話しますが、ロボットは質感、グリップ、圧力フィードバックについてほとんど知りません。また、オクルージョンの問題もあり、オブジェクトが部分的にブロックされていると、ロボットがそれを認識して操作するのが難しくなります。 そして、人間は、物体の全体像が見えなくても、直感的に理解することができます。知覚の問題に加えて、ロボットのアクチュエータ自体にも欠陥があります。 ほとんどのヒューマノイドロボットは、アクチュエーターを関節に直接配置するため、かさばり、潜在的に危険です。 対照的に、人間の腱構造は、よりスムーズで安全な動きを可能にします。 そのため、既存のヒューマノイドロボットは硬くて柔軟性に欠けます。 Apptronikのような企業は、よりバイオインスパイアードなアクチュエータ設計を開発していますが、これらのイノベーションが成熟するには時間がかかります。### ボトルネック4:ハードウェアの拡張が難しいのはなぜか?コンピューティング能力のみに依存する従来のAIモデルとは異なり、インテリジェントロボティクスの実装には、現実世界に物理デバイスを展開する必要があります。 これは、重要な資本上の課題を提起しています。 ロボットを作るには費用がかかり、大規模な実験を行う余裕があるのは、最も裕福な大企業だけです。 最も効率的なヒューマノイドロボットでさえ、今では数万ドルの費用がかかり、大量採用は非現実的になっています。### ボトルネック 5: 有効性を評価するこれは「目に見えない」ボトルネックです。 考えてみれば、ChatGPTのような大規模なオンラインAIモデルは、ほぼ瞬時にその機能をテストでき、新しい言語モデルがリリースされた後、世界中の研究者や一般ユーザーが数時間でそのパフォーマンスについて結論を出すことができます。 しかし、物理的なAIを評価するには、実際の展開が必要であり、時間がかかります。テスラのフルセルフドライビング(FSD)ソフトウェアが良い例です。 テスラが無事故で100万マイルを走ったとしたら、それは本当にレベル5の自動運転に到達したことを意味するのでしょうか? 1,000万マイルはどうですか? ロボティック・インテリジェンスの問題点は、それを検証する唯一の方法は、最終的にどこで失敗するかを確認することであり、これは大規模で長期的なリアルタイム展開を意味します。### ボトルネック6:マンパワーもう1つの過小評価されている課題は、ロボットAIの開発に人間の労働力が依然として不可欠であることです。 AIだけでは不十分です。 ロボットには、人間のオペレーターからのトレーニングデータが必要です。 メンテナンスチームはロボットを動かし続けます。 AIモデルを継続的に最適化するために不可欠な研究者/開発者。 クラウドでトレーニングできるAIモデルとは異なり、ボットは常に人間の介入を必要としますが、これはDePINが対処しなければならない大きな課題です。## 未来:ロボティクスのChatGPTの瞬間はいつ来るのか?ロボット工学におけるChatGPTの瞬間が来ると信じている人もいます。 マイケルはやや懐疑的です。 ハードウェア、データ、評価の課題を考えると、汎用ロボットAIの大量導入にはまだほど遠いと彼は考えています。 しかし、DePINロボティクスの進歩は、いくらかの希望を与えてくれます。 ロボット工学の開発は分散化されるべきであり、少数の大企業によって管理されるべきではありません。 分散型ネットワークの規模と調整は、資本の負担を分散させることができます。 何千台ものロボットにお金を払うために大企業に頼るのではなく、貢献できる個人を共有ネットワークに入れましょう。例えば、何よりもまず、DePINはデータ収集と評価を高速化します。 分散型ネットワークは、企業が限られた数のボットを導入してデータを収集するのを待つのではなく、並行して実行し、はるかに大規模なデータを収集することができます。 たとえば、最近アブダビで開催されたAI対人間のロボティクスコンテストでは、DeepMindやUT Austinなどの機関の研究者が、AIモデルを人間のプレーヤーに対してテストしました。 いまだに人間が優勢ですが、研究者たちは、現実世界のロボットの相互作用から収集されたユニークなデータセットに期待を寄せています。 これは、ロボット工学のさまざまなコンポーネントを接続するサブネットの必要性の証です。 また、研究コミュニティの熱意は、完全な自律性が長期的な目標であることに変わりはないとしても、DePINロボティクスは、データ収集とトレーニングから実際の展開と検証まで、具体的な価値を実証していることを示しています。一方、AIによるチップや材料エンジニアリングの最適化など、AI主導のハードウェア設計の改善により、タイムラインを大幅に短縮できる可能性があります。 具体的な例としては、FrodoBot Lab が他の機関と提携して、それぞれに 8 つの H100 チップを搭載した NVIDIA H100 GPU の 2 つのボックスを確保したときがあります。 これにより、研究者は、ロボットの展開から収集された実世界のデータに対してAIモデルを処理および最適化するために必要な計算能力を得ることができます。 このようなコンピューティングリソースがなければ、最も価値のあるデータセットでさえ十分に活用することはできません。 DePINの分散型コンピューティングインフラストラクチャへのアクセスにより、ロボティクスネットワークにより、世界中の研究者は、資本集約的なGPUの所有に制約されることなく、モデルのトレーニングと評価を行うことができます。 DePINがデータとハードウェアのクラウドソーシングの進歩に成功すれば、ロボット工学の未来は予想よりも早く訪れる可能性があります。さらに、サム(ミームコインを持つ移動インフルエンサーボット)のようなAIエージェントは、分散型ロボットネットワークの新しい収益化モデルを実証しています。 サムは自律的に運営されており、複数の都市で24時間年中無休でライブストリーミングを行っており、そのミームコインの価値も上昇しています。 このモデルは、DEPINを搭載したインテリジェントボットが、分散型所有権とトークンインセンティブを通じて財務を維持する方法を示しています。 将来的には、これらのAIエージェントは、トークンを使用して、人間のオペレーターからの支援の支払い、追加のボット資産のレンタル、または現実世界のタスクへの入札を行い、AI開発とDePIN参加者の両方に利益をもたらす経済サイクルを生み出す可能性があります。## まとめロボットAIの開発は、アルゴリズムだけでなく、ハードウェアのアップグレード、データの蓄積、財政的支援、人間の関与にも依存しています。 これまで、ロボット産業の成長は、高コストと大企業の支配によって制限され、イノベーションのスピードを妨げていました。 DePINボットネットワークの確立は、分散型ネットワークの力で、ロボットのデータ収集、コンピューティングリソース、設備投資を世界規模で調整できることを意味し、AIのトレーニングとハードウェアの最適化を加速するだけでなく、開発の障壁を下げて、より多くの研究者、起業家、および個人ユーザーが参加できるようにします。 また、ロボット業界はもはや少数の巨大テクノロジー企業に頼るのではなく、グローバルコミュニティによって推進され、真にオープンで持続可能なテクノロジーエコシステムに移行することを期待しています。*Coinspireプラットフォーム上のすべてのコンテンツは情報提供のみを目的としており、投資戦略の提案または推奨を構成するものではなく、この記事の内容に基づいて行われた個々の決定は投資家の単独の責任であり、Coinspireはそれに起因するいかなる利益または損失に対しても責任を負いません。投資にはリスクが伴い、慎重に判断する必要があります
DePINと具現化インテリジェンスの技術的課題と将来
! DePINと身体性知能の技術的課題と将来
2月27日、Messariは、FrodoBot Labの共同創設者であるMichael Cho氏とともに、「Building Decentralized Physical AI」に関するポッドキャストを主催しました。 彼らは、ロボティクスにおける分散型物理インフラストラクチャネットワーク(DePIN)の課題と機会について話し合いました。 この分野はまだ初期段階にありますが、現実世界でのAIボットの動作方法に革命を起こす大きな可能性を秘めています。 しかし、大量のインターネットデータに依存する従来のAIとは異なり、DePINロボティクスAIテクノロジーは、データ収集、ハードウェアの制限、評価のボトルネック、経済モデルの持続可能性など、より複雑な問題に直面しています。
今日の記事では、この議論の要点を分析し、DePINロボティクスが直面した問題、分散型ボットのスケーリングに対する主な障壁は何か、そしてDePINが中央集権的な方法よりも有利である理由を見ていきます。 最後に、DePINロボティクスの未来を探り、DePINロボティクスの「ChatGPTモーメント」の瀬戸際にいるかどうかを確認します。
DePINインテリジェントロボットのボトルネックはどこにあるのか?
Michael Cho 氏が FrodoBot の開発に着手したとき、最大の悩みの種はロボット工学のコストでした。 市場に出回っている商用ロボットの価格は途方もなく高く、現実の世界でAIアプリケーションを宣伝することは困難です。 彼の最初の解決策は、既存のほとんどのプロジェクトよりも安い価格で勝つことを意図して、わずか500ドルの低コストの自律型ロボットを構築することでした。
しかし、彼と彼のチームがより深く取り組むにつれて、Michael はコストが実際にはボトルネックではないことに気付きました。 ロボティクスにおける分散型物理インフラストラクチャネットワーク(DePIN)の課題は、「高価かどうか」よりもはるかに複雑です。 FrodoBotLabが進歩し続けるにつれて、DePINロボティクスの複数のボトルネックが浮上しています。 大規模な展開を実現するには、以下のボトルネックを克服する必要があります。
ボトルネック 1: データ
大量のインターネットデータでトレーニングされた大規模な「オンライン」AIモデルとは異なり、具体化されたAI(AI)は、知能を開発するために現実世界との相互作用を必要とします。 問題は、世界にはそのような大規模な基盤がなく、このデータをどのように収集するかについてのコンセンサスがないことです。 エンボディド AI のデータ収集は、次の 3 つの大きなカテゴリに分類できます。
▎1つ目は、人間がロボットを手作業で制御した際に発生するデータである「人の操作データ」です。 このタイプのデータは高品質で、ビデオストリームとモーションタグ、つまり人間が見ているものとそれに応じてどのように反応するかをキャプチャします。 これは、人間の行動を模倣するようにAIをトレーニングする最も効果的な方法ですが、コストと労力がかかるという欠点があります。
▎2つ目のタイプは合成データ(シミュレーションデータ)で、荒れた地面を歩くようにロボットを訓練するなど、複雑な地形を移動するロボットの訓練に非常に役立ち、一部の専門分野で非常に役立ちます。 しかし、料理など、最も多様なタスクでは、環境をシミュレートすることはあまり良くありません。 ロボットに目玉焼きを訓練する状況を想像すると、鍋の種類、油温、部屋の状況のわずかな変化が結果に影響を与える可能性があり、仮想環境ですべてのシーンをカバーすることは困難です。
▎3つ目のカテゴリーは、現実世界の映像を観察してAIモデルに学習させる「動画学習」です。 このアプローチは可能性を秘めていますが、インテリジェンスに必要な実際の物理的で直接的なインタラクティブなフィードバックが欠けています。
ボトルネック2:自律性のレベル
Michael氏は、FrodoBotを現実の世界で最初にテストしたとき、主にラストマイルの配送にロボットを使用していたと述べています。 統計的には、ロボットは配達タスクの90%を無事に完了しました。 しかし、実生活での10%の失敗率は受け入れられません。 10回分娩するごとに失敗するロボットは、単に商業的ではありません。 自動運転技術と同様に、自動運転は10,000回の運転を成功させる記録を持つことができますが、1回の失敗で商用消費者の信頼を損なうのに十分です。
したがって、ロボティクスが真に有用であるためには、成功率が99.99%に近いか、それ以上である必要があります。 しかし、問題は、精度が0.001%向上するごとに、指数関数的な時間と労力がかかることです。 多くの人は、この最後のステップの難しさを過小評価しています。
マイケルは、2015年にGoogleの自動運転車のプロトタイプに座ったとき、完全自動運転が現実のものになる寸前だと感じたと振り返ります。 あれから10年が経った今でも、レベル5がいつ完全に自律的になるかは議論中です。 ロボット工学の進歩は直線的ではなく、指数関数的なものであり、一歩前進するごとに、その難易度は劇的に上昇します。 この最後の1%の正解率を達成するには、数年または数十年かかる場合があります。
ボトルネック3:ハードウェア:AIだけではロボットの問題は解決できない
一歩下がって考えると、最高のAIモデルがあっても、既存のロボットハードウェアは真の自律性を実現する準備ができていません。 例えば、ハードウェアで最も見落とされがちな問題は、触覚センサーの欠如であり、Meta AIの研究など、現在の最高のテクノロジーは、人間の指先の感度には遠く及びません。 人間は視覚と触覚で世界と対話しますが、ロボットは質感、グリップ、圧力フィードバックについてほとんど知りません。
また、オクルージョンの問題もあり、オブジェクトが部分的にブロックされていると、ロボットがそれを認識して操作するのが難しくなります。 そして、人間は、物体の全体像が見えなくても、直感的に理解することができます。
知覚の問題に加えて、ロボットのアクチュエータ自体にも欠陥があります。 ほとんどのヒューマノイドロボットは、アクチュエーターを関節に直接配置するため、かさばり、潜在的に危険です。 対照的に、人間の腱構造は、よりスムーズで安全な動きを可能にします。 そのため、既存のヒューマノイドロボットは硬くて柔軟性に欠けます。 Apptronikのような企業は、よりバイオインスパイアードなアクチュエータ設計を開発していますが、これらのイノベーションが成熟するには時間がかかります。
ボトルネック4:ハードウェアの拡張が難しいのはなぜか?
コンピューティング能力のみに依存する従来のAIモデルとは異なり、インテリジェントロボティクスの実装には、現実世界に物理デバイスを展開する必要があります。 これは、重要な資本上の課題を提起しています。 ロボットを作るには費用がかかり、大規模な実験を行う余裕があるのは、最も裕福な大企業だけです。 最も効率的なヒューマノイドロボットでさえ、今では数万ドルの費用がかかり、大量採用は非現実的になっています。
ボトルネック 5: 有効性を評価する
これは「目に見えない」ボトルネックです。 考えてみれば、ChatGPTのような大規模なオンラインAIモデルは、ほぼ瞬時にその機能をテストでき、新しい言語モデルがリリースされた後、世界中の研究者や一般ユーザーが数時間でそのパフォーマンスについて結論を出すことができます。 しかし、物理的なAIを評価するには、実際の展開が必要であり、時間がかかります。
テスラのフルセルフドライビング(FSD)ソフトウェアが良い例です。 テスラが無事故で100万マイルを走ったとしたら、それは本当にレベル5の自動運転に到達したことを意味するのでしょうか? 1,000万マイルはどうですか? ロボティック・インテリジェンスの問題点は、それを検証する唯一の方法は、最終的にどこで失敗するかを確認することであり、これは大規模で長期的なリアルタイム展開を意味します。
ボトルネック6:マンパワー
もう1つの過小評価されている課題は、ロボットAIの開発に人間の労働力が依然として不可欠であることです。 AIだけでは不十分です。 ロボットには、人間のオペレーターからのトレーニングデータが必要です。 メンテナンスチームはロボットを動かし続けます。 AIモデルを継続的に最適化するために不可欠な研究者/開発者。 クラウドでトレーニングできるAIモデルとは異なり、ボットは常に人間の介入を必要としますが、これはDePINが対処しなければならない大きな課題です。
未来:ロボティクスのChatGPTの瞬間はいつ来るのか?
ロボット工学におけるChatGPTの瞬間が来ると信じている人もいます。 マイケルはやや懐疑的です。 ハードウェア、データ、評価の課題を考えると、汎用ロボットAIの大量導入にはまだほど遠いと彼は考えています。 しかし、DePINロボティクスの進歩は、いくらかの希望を与えてくれます。 ロボット工学の開発は分散化されるべきであり、少数の大企業によって管理されるべきではありません。 分散型ネットワークの規模と調整は、資本の負担を分散させることができます。 何千台ものロボットにお金を払うために大企業に頼るのではなく、貢献できる個人を共有ネットワークに入れましょう。
例えば、何よりもまず、DePINはデータ収集と評価を高速化します。 分散型ネットワークは、企業が限られた数のボットを導入してデータを収集するのを待つのではなく、並行して実行し、はるかに大規模なデータを収集することができます。 たとえば、最近アブダビで開催されたAI対人間のロボティクスコンテストでは、DeepMindやUT Austinなどの機関の研究者が、AIモデルを人間のプレーヤーに対してテストしました。 いまだに人間が優勢ですが、研究者たちは、現実世界のロボットの相互作用から収集されたユニークなデータセットに期待を寄せています。 これは、ロボット工学のさまざまなコンポーネントを接続するサブネットの必要性の証です。 また、研究コミュニティの熱意は、完全な自律性が長期的な目標であることに変わりはないとしても、DePINロボティクスは、データ収集とトレーニングから実際の展開と検証まで、具体的な価値を実証していることを示しています。
一方、AIによるチップや材料エンジニアリングの最適化など、AI主導のハードウェア設計の改善により、タイムラインを大幅に短縮できる可能性があります。 具体的な例としては、FrodoBot Lab が他の機関と提携して、それぞれに 8 つの H100 チップを搭載した NVIDIA H100 GPU の 2 つのボックスを確保したときがあります。 これにより、研究者は、ロボットの展開から収集された実世界のデータに対してAIモデルを処理および最適化するために必要な計算能力を得ることができます。 このようなコンピューティングリソースがなければ、最も価値のあるデータセットでさえ十分に活用することはできません。 DePINの分散型コンピューティングインフラストラクチャへのアクセスにより、ロボティクスネットワークにより、世界中の研究者は、資本集約的なGPUの所有に制約されることなく、モデルのトレーニングと評価を行うことができます。 DePINがデータとハードウェアのクラウドソーシングの進歩に成功すれば、ロボット工学の未来は予想よりも早く訪れる可能性があります。
さらに、サム(ミームコインを持つ移動インフルエンサーボット)のようなAIエージェントは、分散型ロボットネットワークの新しい収益化モデルを実証しています。 サムは自律的に運営されており、複数の都市で24時間年中無休でライブストリーミングを行っており、そのミームコインの価値も上昇しています。 このモデルは、DEPINを搭載したインテリジェントボットが、分散型所有権とトークンインセンティブを通じて財務を維持する方法を示しています。 将来的には、これらのAIエージェントは、トークンを使用して、人間のオペレーターからの支援の支払い、追加のボット資産のレンタル、または現実世界のタスクへの入札を行い、AI開発とDePIN参加者の両方に利益をもたらす経済サイクルを生み出す可能性があります。
まとめ
ロボットAIの開発は、アルゴリズムだけでなく、ハードウェアのアップグレード、データの蓄積、財政的支援、人間の関与にも依存しています。 これまで、ロボット産業の成長は、高コストと大企業の支配によって制限され、イノベーションのスピードを妨げていました。 DePINボットネットワークの確立は、分散型ネットワークの力で、ロボットのデータ収集、コンピューティングリソース、設備投資を世界規模で調整できることを意味し、AIのトレーニングとハードウェアの最適化を加速するだけでなく、開発の障壁を下げて、より多くの研究者、起業家、および個人ユーザーが参加できるようにします。 また、ロボット業界はもはや少数の巨大テクノロジー企業に頼るのではなく、グローバルコミュニティによって推進され、真にオープンで持続可能なテクノロジーエコシステムに移行することを期待しています。
*Coinspireプラットフォーム上のすべてのコンテンツは情報提供のみを目的としており、投資戦略の提案または推奨を構成するものではなく、この記事の内容に基づいて行われた個々の決定は投資家の単独の責任であり、Coinspireはそれに起因するいかなる利益または損失に対しても責任を負いません。
投資にはリスクが伴い、慎重に判断する必要があります