論文の概要: Learning Humanoid Locomotion over Challenging Terrain
- arxiv url: http://arxiv.org/abs/2410.03654v1
- Date: Fri, 4 Oct 2024 17:57:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 20:58:02.714480
- Title: Learning Humanoid Locomotion over Challenging Terrain
- Title(参考訳): 混在地におけるヒューマノイド移動の学習
- Authors: Ilija Radosavovic, Sarthak Kamat, Trevor Darrell, Jitendra Malik,
- Abstract要約: 本研究では,自然と人為的な地形を横断する視覚障害者の移動に対する学習に基づくアプローチを提案する。
本モデルではまず, 時系列モデルを用いた平地軌道のデータセット上で事前学習を行い, 補強学習を用いて不均一な地形を微調整する。
本研究では, 荒面, 変形面, 傾斜面など, 様々な地形にまたがる実際のヒューマノイドロボットを用いて, モデルを評価する。
- 参考スコア(独自算出の注目度): 84.35038297708485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humanoid robots can, in principle, use their legs to go almost anywhere. Developing controllers capable of traversing diverse terrains, however, remains a considerable challenge. Classical controllers are hard to generalize broadly while the learning-based methods have primarily focused on gentle terrains. Here, we present a learning-based approach for blind humanoid locomotion capable of traversing challenging natural and man-made terrain. Our method uses a transformer model to predict the next action based on the history of proprioceptive observations and actions. The model is first pre-trained on a dataset of flat-ground trajectories with sequence modeling, and then fine-tuned on uneven terrain using reinforcement learning. We evaluate our model on a real humanoid robot across a variety of terrains, including rough, deformable, and sloped surfaces. The model demonstrates robust performance, in-context adaptation, and emergent terrain representations. In real-world case studies, our humanoid robot successfully traversed over 4 miles of hiking trails in Berkeley and climbed some of the steepest streets in San Francisco.
- Abstract(参考訳): 人間型ロボットは、原則として、足を使ってほぼどこにでも行ける。
しかし、多様な地形を横断できるコントローラーを開発することは、依然として大きな課題である。
古典的なコントローラーは広く一般化するのは難しいが、学習に基づく手法は主に穏やかな地形に焦点を当てている。
そこで本研究では,自然と人為的な地形を横断する視覚的ヒューマノイド移動の学習的アプローチを提案する。
本手法では, 主観的観察と行動の歴史に基づいて, 次の行動を予測するために, トランスフォーマーモデルを用いる。
このモデルは、まず、シーケンスモデリングを伴う平地軌道のデータセット上で事前訓練され、その後、強化学習を用いて不均一な地形で微調整される。
本研究では, 荒面, 変形面, 傾斜面など, 様々な地形にまたがる実際のヒューマノイドロボットを用いて, モデルを評価する。
このモデルは、堅牢な性能、コンテキスト内適応、創発的な地形表現を示す。
現実のケーススタディでは、私たちのヒューマノイドロボットは、バークレーのハイキングコースを4マイル以上越え、サンフランシスコで最も急な道のいくつかを登った。
関連論文リスト
- Advancing Humanoid Locomotion: Mastering Challenging Terrains with Denoising World Model Learning [11.648198428063415]
本稿では,ヒューマノイド移動制御のためのエンドツーエンド強化学習フレームワークであるDenoising World Model Learning (DWL)を紹介する。
DWLは、野生の雪や傾斜した土地、上下の階段、非常に不均一な地形など、現実世界の挑戦的な地形をマスターする世界初のヒューマノイドロボットを実証している。
論文 参考訳(メタデータ) (2024-08-26T17:59:03Z) - BiRoDiff: Diffusion policies for bipedal robot locomotion on unseen terrains [0.9480364746270075]
未知の地形での移動は、二足歩行ロボットが新しい現実世界の課題に対処するために不可欠である。
複数の地形を移動させる単一の歩行制御系を学習する軽量なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-07T16:03:33Z) - Humanoid Locomotion as Next Token Prediction [84.21335675130021]
我々のモデルは感覚運動軌道の自己回帰予測によって訓練された因果変換器である。
われわれのモデルでは、フルサイズのヒューマノイドがサンフランシスコでゼロショットで歩けることが示されている。
われわれのモデルは、わずか27時間の歩行データで訓練された場合でも現実世界に移行でき、後方歩行のような訓練中に見えないコマンドを一般化することができる。
論文 参考訳(メタデータ) (2024-02-29T18:57:37Z) - Real-World Humanoid Locomotion with Reinforcement Learning [92.85934954371099]
実世界におけるヒューマノイド移動に対する完全学習型アプローチを提案する。
コントローラーは様々な屋外の地形の上を歩けるし、外乱に対して頑丈で、状況に応じて適応できる。
論文 参考訳(メタデータ) (2023-03-06T18:59:09Z) - Legged Locomotion in Challenging Terrains using Egocentric Vision [70.37554680771322]
本稿では,階段,縁石,石段,隙間を横断できる最初のエンドツーエンド移動システムを提案する。
この結果を,1台の前面深度カメラを用いた中型四足歩行ロボットに示す。
論文 参考訳(メタデータ) (2022-11-14T18:59:58Z) - Neural Scene Representation for Locomotion on Structured Terrain [56.48607865960868]
本研究では,都市環境を横断する移動ロボットの局所的な地形を再構築する学習手法を提案する。
搭載されたカメラとロボットの軌道からの深度測定のストリームを用いて、ロボットの近傍の地形を推定する。
ノイズ測定とカメラ配置の盲点からの大量の欠落データにもかかわらず,シーンを忠実に再構築する3次元再構成モデルを提案する。
論文 参考訳(メタデータ) (2022-06-16T10:45:17Z) - Quadruped Locomotion on Non-Rigid Terrain using Reinforcement Learning [10.729374293332281]
非剛性な動的地形上での移動学習のための新しい強化学習フレームワークを提案する。
55cmのトレーニングを受けたロボットは、最大5cmまで沈むことができる地形を歩ける。
様々な地形条件でロボットを訓練することで,本手法の有効性を示す。
論文 参考訳(メタデータ) (2021-07-07T00:34:23Z) - Visual Navigation Among Humans with Optimal Control as a Supervisor [72.5188978268463]
そこで本研究では,学習に基づく知覚とモデルに基づく最適制御を組み合わせることで,人間間をナビゲートする手法を提案する。
私たちのアプローチは、新しいデータ生成ツールであるHumANavによって実現されています。
学習したナビゲーションポリシーは、将来の人間の動きを明示的に予測することなく、人間に予測し、反応できることを実証する。
論文 参考訳(メタデータ) (2020-03-20T16:13:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。