論文の概要: Agile and versatile bipedal robot tracking control through reinforcement learning
- arxiv url: http://arxiv.org/abs/2404.08246v1
- Date: Fri, 12 Apr 2024 05:25:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-15 15:55:31.064202
- Title: Agile and versatile bipedal robot tracking control through reinforcement learning
- Title(参考訳): 強化学習によるアジャイル・多目的二足歩行ロボットのトラッキング制御
- Authors: Jiayi Li, Linqi Ye, Yi Cheng, Houde Liu, Bin Liang,
- Abstract要約: 本稿では,二足歩行ロボットのための多目的コントローラを提案する。
足首と身体の軌跡を、単一の小さなニューラルネットワークを用いて広範囲の歩行で追跡する。
最小限の制御ユニットと高レベルなポリシーを組み合わせることで、高いフレキシブルな歩行制御を実現することができる。
- 参考スコア(独自算出の注目度): 12.831810518025309
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The remarkable athletic intelligence displayed by humans in complex dynamic movements such as dancing and gymnastics suggests that the balance mechanism in biological beings is decoupled from specific movement patterns. This decoupling allows for the execution of both learned and unlearned movements under certain constraints while maintaining balance through minor whole-body coordination. To replicate this balance ability and body agility, this paper proposes a versatile controller for bipedal robots. This controller achieves ankle and body trajectory tracking across a wide range of gaits using a single small-scale neural network, which is based on a model-based IK solver and reinforcement learning. We consider a single step as the smallest control unit and design a universally applicable control input form suitable for any single-step variation. Highly flexible gait control can be achieved by combining these minimal control units with high-level policy through our extensible control interface. To enhance the trajectory-tracking capability of our controller, we utilize a three-stage training curriculum. After training, the robot can move freely between target footholds at varying distances and heights. The robot can also maintain static balance without repeated stepping to adjust posture. Finally, we evaluate the tracking accuracy of our controller on various bipedal tasks, and the effectiveness of our control framework is verified in the simulation environment.
- Abstract(参考訳): ダンスや体操などの複雑な運動において人間によって示される顕著な運動知能は、生物学的生物のバランス機構が特定の運動パターンから切り離されていることを示唆している。
この分離により、学習運動と未学習運動の両方を一定の制約の下で実行し、小さな全身調整を通じてバランスを維持することができる。
本稿では,このバランス能力と体敏性を再現するために,二足歩行ロボットのための多目的制御器を提案する。
本制御器は、モデルベースIKソルバと強化学習に基づく1つの小型ニューラルネットワークを用いて、幅広い歩行域における足首・体軌道追跡を実現する。
単一ステップを最小の制御単位とみなし、任意の単一ステップ変動に適した普遍的な制御入力形式を設計する。
これらの最小限の制御ユニットを、拡張可能な制御インタフェースを通じて高レベルなポリシーと組み合わせることで、高いフレキシブルな歩行制御を実現することができる。
制御器の軌道追跡能力を高めるために,3段階の学習カリキュラムを利用する。
トレーニングの後、ロボットはターゲットの足場の間を、さまざまな距離と高さで自由に移動することができる。
このロボットは、姿勢を調整するために歩みを繰り返すことなく、静止バランスを維持することができる。
最後に, 各種二足歩行作業における制御器のトラッキング精度を評価し, シミュレーション環境における制御フレームワークの有効性を検証した。
関連論文リスト
- Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal
Locomotion Control [112.66677641636299]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - End-to-End Reinforcement Learning for Torque Based Variable Height
Hopping [5.34772724436823]
足の移動は自然または非構造地形を扱うのに最も適しており、多用途であることは間違いない。
本稿では,ジャンプ位相を暗黙的に検出するエンド・ツー・エンドのRL型トルクコントローラを提案する。
また、学習した制御器がリッチな動的タスクに接触できるように、シミュレーション手法を拡張し、ロボットへの展開を成功させる。
論文 参考訳(メタデータ) (2023-07-31T13:51:29Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - On robot compliance. A cerebellar control approach [0.0]
この研究は、ロボットアームをリアルタイムに制御するための新しい生物学的アプローチである(RT)。
トルク駆動制御を行うフィードバック制御ループのコアにスパイク小脳ネットワークを統合する。
本手法は,脳運動の動作に対処するためのタスクセットにおいて,既定の工場設置位置制御の精度より優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T17:06:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。