論文の概要: Chasing Autonomy: Dynamic Retargeting and Control Guided RL for Performant and Controllable Humanoid Running
- arxiv url: http://arxiv.org/abs/2603.25902v1
- Date: Thu, 26 Mar 2026 20:48:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.273517
- Title: Chasing Autonomy: Dynamic Retargeting and Control Guided RL for Performant and Controllable Humanoid Running
- Title(参考訳): Chasing Autonomy: 動的リターゲティングと制御ガイド付きRLによる高性能かつ制御可能なヒューマノイドランニング
- Authors: Zachary Olkin, William D. Compton, Ryan M. Bena, Aaron D. Ames,
- Abstract要約: ヒューマノイドロボットは、速いランニングやダイナミックランニングを含む、人間のようなロコモットを約束する。
人間の動きを模倣できる強化学習コントローラが普及しているが、それらはシングルモーションプレイバックに制限されることが多い。
本稿では,最適化ルーチンを通じて人間の動作を動的に再ターゲットするパイプラインを提案する。
- 参考スコア(独自算出の注目度): 18.386652442201665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humanoid robots have the promise of locomoting like humans, including fast and dynamic running. Recently, reinforcement learning (RL) controllers that can mimic human motions have become popular as they can generate very dynamic behaviors, but they are often restricted to single motion play-back which hinders their deployment in long duration and autonomous locomotion. In this paper, we present a pipeline to dynamically retarget human motions through an optimization routine with hard constraints to generate improved periodic reference libraries from a single human demonstration. We then study the effect of both the reference motion and the reward structure on the reference and commanded velocity tracking, concluding that a goal-conditioned and control-guided reward which tracks dynamically optimized human data results in the best performance. We deploy the policy on hardware, demonstrating its speed and endurance by achieving running speeds of up to 3.3 m/s on a Unitree G1 robot and traversing hundreds of meters in real-world environments. Additionally, to demonstrate the controllability of the locomotion, we use the controller in a full perception and planning autonomy stack for obstacle avoidance while running outdoors.
- Abstract(参考訳): ヒューマノイドロボットは、速いランニングやダイナミックランニングを含む、人間のようなロコモットを約束する。
近年、人間の動作を模倣できる強化学習(RL)コントローラが、非常にダイナミックな動作を生成できるため人気が高まっているが、それらは長時間の展開や自律的な移動を妨げるシングルモーションプレイバックに制限されることが多い。
本稿では,人間の動作を動的にリターゲットするパイプラインを,厳密な制約付き最適化ルーチンで提案し,一人の人間の実演から改善された定期的な参照ライブラリを生成する。
次に、基準運動と報酬構造の両方が基準速度と指令速度の追跡に及ぼす影響について検討し、目標条件付き、制御誘導型報酬が、動的に最適化された人間のデータを追跡することで、最高の性能が得られると結論付けた。
我々は、Unitree G1ロボット上で最大3.3m/sの走行速度を達成し、現実の環境で数百mを走行することで、ハードウェアにポリシーを展開し、その速度と耐久性を実証する。
さらに,移動の制御性を実証するために,屋外走行時の障害物回避のための全認識と自律スタックの計画にコントローラを使用する。
関連論文リスト
- OmniTrack: General Motion Tracking via Physics-Consistent Reference [54.256312586493415]
OmniTrackは、一般的なモーショントラッキングから物理的実現可能性を明確に分離する一般的なトラッキングフレームワークである。
実験により、OmniTrackは追跡精度を向上し、目に見えない動きに対して強力な一般化を示すことが示された。
実世界のテストでは、OmniTrackは、フリップやカートホイールのような複雑なアクロバティックな動きを含む、1時間の長さ、一貫性、安定したトラッキングを実現している。
論文 参考訳(メタデータ) (2026-02-27T09:12:15Z) - KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [58.73043119128804]
そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。
動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。
動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。
実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文 参考訳(メタデータ) (2025-06-15T13:58:53Z) - Dexterous Legged Locomotion in Confined 3D Spaces with Reinforcement
Learning [37.95557495560936]
低レベルな動作コマンドを生成することで,これらの経路を追従するように訓練されたRLベースのポリシーと,従来の計画的計画立案を組み合わさった階層型移動制御器を導入する。
シミュレーションでは、我々の階層的アプローチは制限された3D環境をナビゲートすることに成功し、純粋なエンドツーエンド学習アプローチとパラメータ化された運動スキルの両方を上回ります。
論文 参考訳(メタデータ) (2024-03-06T16:49:08Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Learning Low-Frequency Motion Control for Robust and Dynamic Robot
Locomotion [10.838285018473725]
実ANYmal C四重極上で8Hzの低速動作を行う学習モーションコントローラを用いて,ロバストでダイナミックな移動を実演する。
このロボットは、1.5m/sの高速度を頑健かつ反復的に達成し、不均一な地形を横切ることができ、予期せぬ外乱に抵抗することができる。
論文 参考訳(メタデータ) (2022-09-29T15:55:33Z) - Learning to Exploit Elastic Actuators for Quadruped Locomotion [7.9585932082270014]
足の移動におけるスプリングベースのアクチュエータは、エネルギー効率と性能の向上を提供するが、コントローラ設計の難しさは増す。
実ロボットでモデルフリーのコントローラを直接学習することを提案する。
提案手法をDLR弾性四重項ベルトに適用した。
論文 参考訳(メタデータ) (2022-09-15T09:43:17Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。