論文の概要: Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal
Locomotion Control
- arxiv url: http://arxiv.org/abs/2401.16889v1
- Date: Tue, 30 Jan 2024 10:48:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 15:34:07.025416
- Title: Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal
Locomotion Control
- Title(参考訳): 垂直・動的・ロバストな二足歩行制御のための強化学習
- Authors: Zhongyu Li, Xue Bin Peng, Pieter Abbeel, Sergey Levine, Glen Berseth,
Koushil Sreenath
- Abstract要約: 本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
- 参考スコア(独自算出の注目度): 112.66677641636299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a comprehensive study on using deep reinforcement
learning (RL) to create dynamic locomotion controllers for bipedal robots.
Going beyond focusing on a single locomotion skill, we develop a general
control solution that can be used for a range of dynamic bipedal skills, from
periodic walking and running to aperiodic jumping and standing. Our RL-based
controller incorporates a novel dual-history architecture, utilizing both a
long-term and short-term input/output (I/O) history of the robot. This control
architecture, when trained through the proposed end-to-end RL approach,
consistently outperforms other methods across a diverse range of skills in both
simulation and the real world.The study also delves into the adaptivity and
robustness introduced by the proposed RL system in developing locomotion
controllers. We demonstrate that the proposed architecture can adapt to both
time-invariant dynamics shifts and time-variant changes, such as contact
events, by effectively using the robot's I/O history. Additionally, we identify
task randomization as another key source of robustness, fostering better task
generalization and compliance to disturbances. The resulting control policies
can be successfully deployed on Cassie, a torque-controlled human-sized bipedal
robot. This work pushes the limits of agility for bipedal robots through
extensive real-world experiments. We demonstrate a diverse range of locomotion
skills, including: robust standing, versatile walking, fast running with a
demonstration of a 400-meter dash, and a diverse set of jumping skills, such as
standing long jumps and high jumps.
- Abstract(参考訳): 本稿では,二足歩行ロボットのための動的ロコモーション制御系を作成するために,深層強化学習(rl)を用いた包括的研究を行う。
単一の歩行スキルに焦点を絞るだけでなく、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行スキルに使用できる汎用的な制御ソリューションを開発した。
ロボットの長期的・短期的な入出力(I/O)履歴を生かした,新しいデュアルヒストリーアーキテクチャをRLベースのコントローラに組み込んだ。
この制御アーキテクチャは,提案するエンド・ツー・エンドのrlアプローチによって訓練された場合,シミュレーションと実世界の両方において,他の手法よりも一貫して優れており,提案するrlシステムがロコモーションコントローラの開発に導入した適応性と頑健性にも焦点を当てている。
提案アーキテクチャは,ロボットのI/O履歴を効果的に利用することにより,時間不変のダイナミクスシフトと接触イベントなどの時間変動に適応できることを実証する。
さらに,タスクのランダム化をロバスト性の重要な源とし,タスクの一般化と外乱へのコンプライアンスを促進させる。
得られた制御ポリシーは、トルク制御された2足歩行ロボットであるcassieにうまく展開することができる。
この作業は,実世界の広範囲な実験を通じて,二足歩行ロボットのアジリティの限界を押し上げるものだ。
本研究では,400mのダッシュを実演して,ロコモーションスキルの多種多様さ,頑健な立位,多用途歩行,高速ランニング,立位長跳び,ハイジャンプといった多種多様なジャンプスキルを実演する。
関連論文リスト
- Agile and versatile bipedal robot tracking control through reinforcement learning [12.831810518025309]
本稿では,二足歩行ロボットのための多目的コントローラを提案する。
足首と身体の軌跡を、単一の小さなニューラルネットワークを用いて広範囲の歩行で追跡する。
最小限の制御ユニットと高レベルなポリシーを組み合わせることで、高いフレキシブルな歩行制御を実現することができる。
論文 参考訳(メタデータ) (2024-04-12T05:25:03Z) - End-to-End Reinforcement Learning for Torque Based Variable Height
Hopping [5.34772724436823]
足の移動は自然または非構造地形を扱うのに最も適しており、多用途であることは間違いない。
本稿では,ジャンプ位相を暗黙的に検出するエンド・ツー・エンドのRL型トルクコントローラを提案する。
また、学習した制御器がリッチな動的タスクに接触できるように、シミュレーション手法を拡張し、ロボットへの展開を成功させる。
論文 参考訳(メタデータ) (2023-07-31T13:51:29Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Creating a Dynamic Quadrupedal Robotic Goalkeeper with Reinforcement
Learning [18.873152528330063]
本稿では,4足歩行ロボットが実世界でサッカーのゴールキーピングタスクを実行できる強化学習(RL)フレームワークを提案する。
四足歩行を用いたサッカーのゴールキーピングは難しい問題であり、非常にダイナミックな移動と、正確で高速な非包括的(ボール)操作を組み合わせたものである。
提案するフレームワークをMini Cheetah四脚ロボットにデプロイし,実世界における高速移動球のアジャイルインターセプションにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-10T04:54:55Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。