論文の概要: Learning Humanoid Locomotion with World Model Reconstruction
- arxiv url: http://arxiv.org/abs/2502.16230v1
- Date: Sat, 22 Feb 2025 13:57:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:52:05.356536
- Title: Learning Humanoid Locomotion with World Model Reconstruction
- Title(参考訳): 世界モデル再構成によるヒューマノイド運動の学習
- Authors: Wandong Sun, Long Chen, Yongbo Su, Baoshi Cao, Yang Liu, Zongwu Xie,
- Abstract要約: 視覚障害者のためのエンド・ツー・エンドの学習手法であるワールド・モデル・コンストラクション(WMR)を導入する。
我々は、世界国家を明示的に再構築し、それを利用して移動政策を強化するよう、推定器を訓練する。
ロボットは人間の助けなしに3.2kmのハイキングを成功させた。
- 参考スコア(独自算出の注目度): 8.27902320260747
- License:
- Abstract: Humanoid robots are designed to navigate environments accessible to humans using their legs. However, classical research has primarily focused on controlled laboratory settings, resulting in a gap in developing controllers for navigating complex real-world terrains. This challenge mainly arises from the limitations and noise in sensor data, which hinder the robot's understanding of itself and the environment. In this study, we introduce World Model Reconstruction (WMR), an end-to-end learning-based approach for blind humanoid locomotion across challenging terrains. We propose training an estimator to explicitly reconstruct the world state and utilize it to enhance the locomotion policy. The locomotion policy takes inputs entirely from the reconstructed information. The policy and the estimator are trained jointly; however, the gradient between them is intentionally cut off. This ensures that the estimator focuses solely on world reconstruction, independent of the locomotion policy's updates. We evaluated our model on rough, deformable, and slippery surfaces in real-world scenarios, demonstrating robust adaptability and resistance to interference. The robot successfully completed a 3.2 km hike without any human assistance, mastering terrains covered with ice and snow.
- Abstract(参考訳): ヒューマノイドロボットは、足を使って人間がアクセス可能な環境をナビゲートするように設計されている。
しかし、古典的な研究は主に制御された実験室の設定に焦点を当てており、結果として複雑な現実世界の地形をナビゲートするコントローラーの開発にギャップが生じた。
この課題は、主にセンサーデータの制限とノイズから生じ、ロボットが自分自身と環境を理解するのを妨げる。
本研究では,視覚障害者が困難な地形を横断的に移動するためのエンド・ツー・エンドの学習に基づくアプローチであるWorld Model Reconstruction (WMR)を紹介する。
我々は、世界国家を明示的に再構築し、それを利用して移動政策を強化するための推定器の訓練を提案する。
移動ポリシーは、再構成された情報から完全に入力を受け取る。
政策と推定器は共同で訓練されるが、それらの間の勾配は意図的に遮断される。
これにより、ロコモーション政策の更新とは無関係に、推定者が世界の復興にのみ焦点をあてることが保証される。
実世界のシナリオにおいて, 粗面, 変形面, すべり面のモデルを評価し, 頑健な適応性と干渉抵抗性を実証した。
ロボットは人間の助けなしに3.2kmのハイキングを成功させ、氷と雪で覆われた地形をマスターした。
関連論文リスト
- Learning Humanoid Locomotion over Challenging Terrain [84.35038297708485]
本研究では,自然と人為的な地形を横断する視覚障害者の移動に対する学習に基づくアプローチを提案する。
本モデルではまず, 時系列モデルを用いた平地軌道のデータセット上で事前学習を行い, 補強学習を用いて不均一な地形を微調整する。
本研究では, 荒面, 変形面, 傾斜面など, 様々な地形にまたがる実際のヒューマノイドロボットを用いて, モデルを評価する。
論文 参考訳(メタデータ) (2024-10-04T17:57:09Z) - Advancing Humanoid Locomotion: Mastering Challenging Terrains with Denoising World Model Learning [11.648198428063415]
本稿では,ヒューマノイド移動制御のためのエンドツーエンド強化学習フレームワークであるDenoising World Model Learning (DWL)を紹介する。
DWLは、野生の雪や傾斜した土地、上下の階段、非常に不均一な地形など、現実世界の挑戦的な地形をマスターする世界初のヒューマノイドロボットを実証している。
論文 参考訳(メタデータ) (2024-08-26T17:59:03Z) - Autonomous Robotic Reinforcement Learning with Asynchronous Human
Feedback [27.223725464754853]
GEARは、ロボットを現実世界の環境に配置し、中断することなく自律的に訓練することを可能にする。
システムはリモート、クラウドソース、非専門家からの非同期フィードバックのみを必要とする、Webインターフェースにロボットエクスペリエンスをストリームする。
論文 参考訳(メタデータ) (2023-10-31T16:43:56Z) - Real-World Humanoid Locomotion with Reinforcement Learning [92.85934954371099]
実世界におけるヒューマノイド移動に対する完全学習型アプローチを提案する。
コントローラーは様々な屋外の地形の上を歩けるし、外乱に対して頑丈で、状況に応じて適応できる。
論文 参考訳(メタデータ) (2023-03-06T18:59:09Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z) - Learning to Walk in the Real World with Minimal Human Effort [80.7342153519654]
我々は,人間の努力を最小限に抑えて,現実世界の深いRLを用いた足の移動ポリシーを学習するシステムを開発した。
人間の介入がほとんどないミニチュアロボットにおいて,ロボットの移動スキルを自動的かつ効率的に学習することができる。
論文 参考訳(メタデータ) (2020-02-20T03:36:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。