論文の概要: Learning multiple gaits of quadruped robot using hierarchical
reinforcement learning
- arxiv url: http://arxiv.org/abs/2112.04741v1
- Date: Thu, 9 Dec 2021 07:45:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-10 15:26:55.471848
- Title: Learning multiple gaits of quadruped robot using hierarchical
reinforcement learning
- Title(参考訳): 階層強化学習を用いた四足歩行ロボットの複数歩行学習
- Authors: Yunho Kim, Bukun Son, and Dongjun Lee
- Abstract要約: 本研究では,速度コマンドを追従しながら複数の歩行を生成できる四足歩行ロボットの階層型制御器を提案する。
実験の結果,1) 特定の速度範囲に対する最適歩行の存在,2) 一つのポリシーからなる制御器と比較して階層的な制御器の効率性が示された。
- 参考スコア(独自算出の注目度): 9.60618440185329
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is a growing interest in learning a velocity command tracking
controller of quadruped robot using reinforcement learning due to its
robustness and scalability. However, a single policy, trained end-to-end,
usually shows a single gait regardless of the command velocity. This could be a
suboptimal solution considering the existence of optimal gait according to the
velocity for quadruped animals. In this work, we propose a hierarchical
controller for quadruped robot that could generate multiple gaits (i.e. pace,
trot, bound) while tracking velocity command. Our controller is composed of two
policies, each working as a central pattern generator and local feedback
controller, and trained with hierarchical reinforcement learning. Experiment
results show 1) the existence of optimal gait for specific velocity range 2)
the efficiency of our hierarchical controller compared to a controller composed
of a single policy, which usually shows a single gait. Codes are publicly
available.
- Abstract(参考訳): 頑丈さとスケーラビリティから強化学習を用いて,四足歩行ロボットの速度コマンドトラッキングコントローラの学習への関心が高まっている。
しかし、訓練されたエンドツーエンドの単一のポリシーは、通常はコマンドの速度に関係なく単一の歩数を示す。
これは、四足動物の速度に応じて最適な歩行が存在することを考慮すれば、亜最適解となるかもしれない。
本研究では,速度指令を追従しながら複数の歩数(ペース,トロット,バウンド)を生成できる四足歩行ロボットの階層型制御器を提案する。
我々のコントローラは2つのポリシーで構成されており、それぞれが中央パターン生成器と局所フィードバック制御器として機能し、階層的強化学習で訓練されている。
実験の結果
1)特定速度範囲における最適歩行の存在
2) 階層型コントローラの効率は, 1 つのポリシーからなるコントローラと比較すると, 通常は1 つの歩行を示す。
コードは公開されている。
関連論文リスト
- Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Creating a Dynamic Quadrupedal Robotic Goalkeeper with Reinforcement
Learning [18.873152528330063]
本稿では,4足歩行ロボットが実世界でサッカーのゴールキーピングタスクを実行できる強化学習(RL)フレームワークを提案する。
四足歩行を用いたサッカーのゴールキーピングは難しい問題であり、非常にダイナミックな移動と、正確で高速な非包括的(ボール)操作を組み合わせたものである。
提案するフレームワークをMini Cheetah四脚ロボットにデプロイし,実世界における高速移動球のアジャイルインターセプションにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-10T04:54:55Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - Learning fast and agile quadrupedal locomotion over complex terrain [0.3806109052869554]
本研究は,視覚障害者用4足歩行ロボットにおいて,自然かつ安定に高速な移動を実現する頑健な制御器を提案する。
モデルレス強化学習によりシミュレーション環境で学習する。
我々の制御器は優れた反ゆらぎ性能を有し、学習したことのない移動速度に到達できる優れた一般化能力を有する。
論文 参考訳(メタデータ) (2022-07-02T11:20:07Z) - Fast and Efficient Locomotion via Learned Gait Transitions [35.86279693549959]
四足歩行ロボットのための効率的な制御器の開発に焦点をあてる。
特徴ある移動経路と自然な歩行遷移が自動的に現れる階層的学習フレームワークを考案する。
学習した階層型コントローラは,ベースラインコントローラよりも広い移動速度でエネルギーを消費することがわかった。
論文 参考訳(メタデータ) (2021-04-09T23:53:28Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。