論文の概要: Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2502.17219v1
- Date: Mon, 24 Feb 2025 14:53:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:51:59.496196
- Title: Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning
- Title(参考訳): 動的バランスと強化学習による狭い地形上のヒューマノイド全体移動
- Authors: Weiji Xie, Chenjia Bai, Jiyuan Shi, Junkai Yang, Yunfei Ge, Weinan Zhang, Xuelong Li,
- Abstract要約: 動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
- 参考スコア(独自算出の注目度): 54.26816599309778
- License:
- Abstract: Humans possess delicate dynamic balance mechanisms that enable them to maintain stability across diverse terrains and under extreme conditions. However, despite significant advances recently, existing locomotion algorithms for humanoid robots are still struggle to traverse extreme environments, especially in cases that lack external perception (e.g., vision or LiDAR). This is because current methods often rely on gait-based or perception-condition rewards, lacking effective mechanisms to handle unobservable obstacles and sudden balance loss. To address this challenge, we propose a novel whole-body locomotion algorithm based on dynamic balance and Reinforcement Learning (RL) that enables humanoid robots to traverse extreme terrains, particularly narrow pathways and unexpected obstacles, using only proprioception. Specifically, we introduce a dynamic balance mechanism by leveraging an extended measure of Zero-Moment Point (ZMP)-driven rewards and task-driven rewards in a whole-body actor-critic framework, aiming to achieve coordinated actions of the upper and lower limbs for robust locomotion. Experiments conducted on a full-sized Unitree H1-2 robot verify the ability of our method to maintain balance on extremely narrow terrains and under external disturbances, demonstrating its effectiveness in enhancing the robot's adaptability to complex environments. The videos are given at https://whole-body-loco.github.io.
- Abstract(参考訳): 人間は、様々な地形や極端な条件下での安定性を維持するための微妙な動的バランス機構を持っている。
しかし、近年の大きな進歩にもかかわらず、既存のヒューマノイドロボットの移動アルゴリズムは、特に外的知覚が欠けている場合(例えば、視覚やLiDAR)、極端な環境を横切るのに苦戦している。
これは、現在の手法が歩行ベースや知覚条件の報酬に依存しており、観測不能な障害や突然のバランス損失を扱う効果的なメカニズムが欠如しているためである。
この課題に対処するために,人間型ロボットが極端な地形,特に狭い経路や予期せぬ障害物をプロプレセプションのみを用いて横切ることを可能にする,ダイナミックバランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ゼロ・モーメント・ポイント(ZMP)駆動の報酬とタスク駆動の報酬を,上肢と下肢の協調動作によるロバスト・ロコモーションの実現を目的として拡張した動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットを用いた実験は、非常に狭い地形や外乱下でのバランスを維持するための手法の有効性を検証し、ロボットの複雑な環境への適応性を高める効果を実証した。
ビデオはhttps://whole-body-loco.github.io.comで公開されている。
関連論文リスト
- Learning Humanoid Standing-up Control across Diverse Postures [27.79222176982376]
本稿では,立ち上がり制御をゼロから学習する強化学習フレームワークであるHoST(Humanoid Standing-up Control)を提案する。
HoSTは、多面的アーキテクチャと多様なシミュレーション地形におけるカリキュラムベースのトレーニングを活用して、姿勢適応運動を効果的に学習する。
実験結果から, 各種実験室および屋外環境におけるスムーズ, 安定, 頑健な立位運動が得られた。
論文 参考訳(メタデータ) (2025-02-12T13:10:09Z) - Learning Bipedal Walking for Humanoid Robots in Challenging Environments with Obstacle Avoidance [0.3481985817302898]
深層強化学習は、動的歩行を実現するためのヒューマノイドロボットの実装に成功している。
本稿では,政策に基づく強化学習を用いて,障害物が存在する環境下での2足歩行を実現することを目的とする。
論文 参考訳(メタデータ) (2024-09-25T07:02:04Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Natural and Robust Walking using Reinforcement Learning without
Demonstrations in High-Dimensional Musculoskeletal Models [29.592874007260342]
人間は複雑な自然環境の中を歩く頑丈な二足歩行で運動します。
神経系が筋骨格の冗長性をどのように解決し、多目的制御問題を解決するかは、まだ完全には分かっていない。
論文 参考訳(メタデータ) (2023-09-06T13:20:31Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Learning Control Policies for Fall prevention and safety in bipedal
locomotion [0.0]
本研究では,2種類のロボットに対して,プッシュリカバリ制御ポリシを合成可能な学習ベースアルゴリズムを開発した。
1)ヒューマノイドロボットの安全落下防止戦略の学習,2)ロボット支援装置を用いたヒトの転倒防止戦略の学習,である。
論文 参考訳(メタデータ) (2022-01-04T22:00:21Z) - Next Steps: Learning a Disentangled Gait Representation for Versatile
Quadruped Locomotion [69.87112582900363]
現在のプランナーは、ロボットが動いている間、キー歩行パラメータを連続的に変更することはできない。
本研究では、特定の歩行を構成する重要な姿勢位相を捉える潜在空間を学習することにより、この制限に対処する。
本研究では, 歩幅, 歩幅, 立位など, 歩行パラメータに直接対応した駆動信号マップの具体的特性を示す。
論文 参考訳(メタデータ) (2021-12-09T10:02:02Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。