論文の概要: Learning Whole-Body Humanoid Locomotion via Motion Generation and Motion Tracking
- arxiv url: http://arxiv.org/abs/2604.17335v1
- Date: Sun, 19 Apr 2026 09:02:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.471618
- Title: Learning Whole-Body Humanoid Locomotion via Motion Generation and Motion Tracking
- Title(参考訳): モーションジェネレーションとモーショントラッキングによる全身ヒューマノイドロコモーションの学習
- Authors: Zewei Zhang, Kehan Wen, Michael Xu, Junzhe He, Chenhao Li, Takahiro Miki, Clemens Schwarke, Chong Zhang, Xue Bin Peng, Marco Hutter,
- Abstract要約: 高次元制御、形態的不安定性、および車載認識を用いた様々な地形へのリアルタイム適応の必要性により、全身のヒューマノイド移動は困難である。
本研究では,参照動作から学んだスキルと地形認識適応を組み合わせた全身ヒューマノイド移動フレームワークを提案する。
- 参考スコア(独自算出の注目度): 22.8041193953823
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Whole-body humanoid locomotion is challenging due to high-dimensional control, morphological instability, and the need for real-time adaptation to various terrains using onboard perception. Directly applying reinforcement learning (RL) with reward shaping to humanoid locomotion often leads to lower-body-dominated behaviors, whereas imitation-based RL can learn more coordinated whole-body skills but is typically limited to replaying reference motions without a mechanism to adapt them online from perception for terrain-aware locomotion. To address this gap, we propose a whole-body humanoid locomotion framework that combines skills learned from reference motions with terrain-aware adaptation. We first train a diffusion model on retargeted human motions for real-time prediction of terrain-aware reference motions. Concurrently, we train a whole-body reference tracker with RL using this motion data. To improve robustness under imperfectly generated references, we further fine-tune the tracker with a frozen motion generator in a closed-loop setting. The resulting system supports directional goal-reaching control with terrain-aware whole-body adaptation, and can be deployed on a Unitree G1 humanoid robot with onboard perception and computation. The hardware experiments demonstrate successful traversal over boxes, hurdles, stairs, and mixed terrain combinations. Quantitative results further show the benefits of incorporating online motion generation and fine-tuning the motion tracker for improved generalization and robustness.
- Abstract(参考訳): 高次元制御、形態的不安定性、および車載認識を用いた様々な地形へのリアルタイム適応の必要性により、全身のヒューマノイド移動は困難である。
人型ロコモーションに対する報酬形成を伴う強化学習(RL)を直接適用すると、低体格の行動につながることが多いが、模倣に基づくRLは、より協調した全身スキルを学ぶことができるが、通常は、地形に意識されたロコモーションの知覚からそれらをオンラインに適応するメカニズムを持たない参照運動の再生に制限される。
このギャップに対処するために、参照動作から学んだスキルと地形認識適応を組み合わせた全身ヒューマノイド移動フレームワークを提案する。
まず、地形を考慮した参照動作のリアルタイム予測のために、再ターゲットされた人間の動きの拡散モデルを訓練する。
同時に、この動きデータを用いて、RLを用いた全身参照トラッカーを訓練する。
不完全な基準条件下でのロバスト性を改善するため、閉ループ設定で凍結運動発生器でトラッカーをさらに微調整する。
このシステムは、ランドスケープを意識した全体適応による指向性目標到達制御をサポートし、搭載された知覚と計算を備えたユニツリーG1ヒューマノイドロボットに展開することができる。
ハードウェア実験では、箱、ハードル、階段、混合地形の組み合わせを乗り越えることに成功した。
さらに,オンライン動作生成と運動トラッカーの微調整による一般化とロバスト性向上のメリットが定量的に示された。
関連論文リスト
- Chasing Autonomy: Dynamic Retargeting and Control Guided RL for Performant and Controllable Humanoid Running [18.386652442201665]
ヒューマノイドロボットは、速いランニングやダイナミックランニングを含む、人間のようなロコモットを約束する。
人間の動きを模倣できる強化学習コントローラが普及しているが、それらはシングルモーションプレイバックに制限されることが多い。
本稿では,最適化ルーチンを通じて人間の動作を動的に再ターゲットするパイプラインを提案する。
論文 参考訳(メタデータ) (2026-03-26T20:48:33Z) - Gait-Adaptive Perceptive Humanoid Locomotion with Real-Time Under-Base Terrain Reconstruction [86.53248703859718]
本研究では,地形認識,歩行制御,全身制御を一つの強化学習ポリシーにマージする知覚的移動フレームワークを提案する。
31-DoF、1.65mのヒューマノイドロボットによる実験は、シミュレーションと実世界の両方で堅牢な移動を実証している。
論文 参考訳(メタデータ) (2025-12-08T11:42:41Z) - Learning Humanoid Standing-up Control across Diverse Postures [27.79222176982376]
立ち上がり制御はヒューマノイドロボットにとって不可欠であり、現在の移動と移動操作システムに統合される可能性がある。
本稿では,立ち上がり制御をゼロから学習する強化学習フレームワークであるHoST(Humanoid Standing-up Control)を提案する。
実験結果から, 各種実験室および屋外環境におけるスムーズ, 安定, 頑健な立位運動が得られた。
論文 参考訳(メタデータ) (2025-02-12T13:10:09Z) - Dexterous Legged Locomotion in Confined 3D Spaces with Reinforcement
Learning [37.95557495560936]
低レベルな動作コマンドを生成することで,これらの経路を追従するように訓練されたRLベースのポリシーと,従来の計画的計画立案を組み合わさった階層型移動制御器を導入する。
シミュレーションでは、我々の階層的アプローチは制限された3D環境をナビゲートすることに成功し、純粋なエンドツーエンド学習アプローチとパラメータ化された運動スキルの両方を上回ります。
論文 参考訳(メタデータ) (2024-03-06T16:49:08Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Universal Humanoid Motion Representations for Physics-Based Control [71.46142106079292]
物理学に基づくヒューマノイド制御のための総合的な運動スキルを含む普遍的な運動表現を提案する。
まず、大きな非構造運動データセットから人間の動きをすべて模倣できる動き模倣機を学習する。
次に、模倣者から直接スキルを蒸留することで、動作表現を作成します。
論文 参考訳(メタデータ) (2023-10-06T20:48:43Z) - An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文 参考訳(メタデータ) (2021-10-28T10:14:47Z) - UniCon: Universal Neural Controller For Physics-based Character Motion [70.45421551688332]
大規模動作データセットから学習することで,異なるスタイルで数千の動作を習得する物理ベースのユニバーサルニューラルコントローラ(UniCon)を提案する。
UniConは、キーボード駆動制御をサポートし、ロコモーションとアクロバティックスキルの大きなプールから引き出されたモーションシーケンスを作成し、ビデオで撮影した人を物理ベースの仮想アバターにテレポートする。
論文 参考訳(メタデータ) (2020-11-30T18:51:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。