論文の概要: Adapting Rapid Motor Adaptation for Bipedal Robots
- arxiv url: http://arxiv.org/abs/2205.15299v1
- Date: Mon, 30 May 2022 17:59:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 14:25:28.755996
- Title: Adapting Rapid Motor Adaptation for Bipedal Robots
- Title(参考訳): 二足歩行ロボットの高速モータ適応
- Authors: Ashish Kumar, Zhongyu Li, Jun Zeng, Deepak Pathak, Koushil Sreenath,
Jitendra Malik
- Abstract要約: 移動制御の急速な適応の最近の進歩を活用し、二足歩行ロボットで作業できるように拡張する。
A-RMAはモデルフリーRLを用いて微調整することで不完全外部推定器の基本方針を適応する。
シミュレーションにおいて,A-RMAはRLベースのベースラインコントローラやモデルベースコントローラよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 73.5914982741483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in legged locomotion have enabled quadrupeds to walk on
challenging terrains. However, bipedal robots are inherently more unstable and
hence it's harder to design walking controllers for them. In this work, we
leverage recent advances in rapid adaptation for locomotion control, and extend
them to work on bipedal robots. Similar to existing works, we start with a base
policy which produces actions while taking as input an estimated extrinsics
vector from an adaptation module. This extrinsics vector contains information
about the environment and enables the walking controller to rapidly adapt
online. However, the extrinsics estimator could be imperfect, which might lead
to poor performance of the base policy which expects a perfect estimator. In
this paper, we propose A-RMA (Adapting RMA), which additionally adapts the base
policy for the imperfect extrinsics estimator by finetuning it using model-free
RL. We demonstrate that A-RMA outperforms a number of RL-based baseline
controllers and model-based controllers in simulation, and show zero-shot
deployment of a single A-RMA policy to enable a bipedal robot, Cassie, to walk
in a variety of different scenarios in the real world beyond what it has seen
during training. Videos and results at https://ashish-kmr.github.io/a-rma/
- Abstract(参考訳): 近年の脚歩行の進歩により、四足歩行は挑戦的な地形を歩けるようになった。
しかし、二足歩行ロボットは本質的に不安定なので、歩行制御器の設計は困難です。
本研究は,移動制御の高速化における最近の進歩を活用し,二足歩行ロボットで作業できるように拡張する。
既存の作業と同様に、適応モジュールから推定外生ベクトルを入力として実行しながらアクションを生成する基本ポリシーから始める。
この外部ベクトルは環境に関する情報を含み、歩行制御装置がオンラインで迅速に適応できるようにする。
しかし、extrinsics estimatorは不完全である可能性があり、それによって完璧な推定子を期待するベースポリシーのパフォーマンスが低下する可能性がある。
本稿では,モデルフリーRLを用いて非完全外部推定器の基本方針を微調整することで,A-RMA(Adapting RMA)を提案する。
A-RMAは、シミュレーションにおいて、多数のRLベースのベースラインコントローラやモデルベースのコントローラより優れており、また、2足歩行ロボットであるCassieが、トレーニング中に見た以上のさまざまなシナリオで歩けるように、単一のA-RMAポリシーのゼロショット展開を示す。
https://ashish-kmr.github.io/a-rma/
関連論文リスト
- BiRoDiff: Diffusion policies for bipedal robot locomotion on unseen terrains [0.9480364746270075]
未知の地形での移動は、二足歩行ロボットが新しい現実世界の課題に対処するために不可欠である。
複数の地形を移動させる単一の歩行制御系を学習する軽量なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-07T16:03:33Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Combining model-predictive control and predictive reinforcement learning
for stable quadrupedal robot locomotion [0.0]
モデル予測型と予測型強化型学習コントローラの組み合わせによりこれを実現できるかを検討する。
本研究では,両制御手法を組み合わせて,四足歩行ロボットの安定ゲート生成問題に対処する。
論文 参考訳(メタデータ) (2023-07-15T09:22:37Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - RMA: Rapid Motor Adaptation for Legged Robots [71.61319876928009]
本稿では,四足歩行ロボットにおけるリアルタイムオンライン適応の課題を解決するために,ラピッドモータ適応(RMA)アルゴリズムを提案する。
RMAは、参照軌跡や事前に定義された足跡生成器のようなドメイン知識を使わずに、完全にシミュレーションで訓練される。
我々は、生物エネルギーにインスパイアされた報酬を用いて様々な地形発生装置でRMAを訓練し、様々な困難な地形に展開する。
論文 参考訳(メタデータ) (2021-07-08T17:59:59Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。