論文の概要: An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples
- arxiv url: http://arxiv.org/abs/2110.14998v1
- Date: Thu, 28 Oct 2021 10:14:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-30 04:15:16.725819
- Title: An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples
- Title(参考訳): 実例のない実情足歩行学習への適応的アプローチ
- Authors: Daniel Felipe Ordo\~nez Apraez, Antonio Agudo, Francesc Moreno-Noguer
and Mario Martin
- Abstract要約: 本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
- 参考スコア(独自算出の注目度): 38.81854337592694
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning controllers that reproduce legged locomotion in nature have been a
long-time goal in robotics and computer graphics. While yielding promising
results, recent approaches are not yet flexible enough to be applicable to
legged systems of different morphologies. This is partly because they often
rely on precise motion capture references or elaborate learning environments
that ensure the naturality of the emergent locomotion gaits but prevent
generalization. This work proposes a generic approach for ensuring realism in
locomotion by guiding the learning process with the spring-loaded inverted
pendulum model as a reference. Leveraging on the exploration capacities of
Reinforcement Learning (RL), we learn a control policy that fills in the
information gap between the template model and full-body dynamics required to
maintain stable and periodic locomotion. The proposed approach can be applied
to robots of different sizes and morphologies and adapted to any RL technique
and control architecture. We present experimental results showing that even in
a model-free setup and with a simple reactive control architecture, the learned
policies can generate realistic and energy-efficient locomotion gaits for a
bipedal and a quadrupedal robot. And most importantly, this is achieved without
using motion capture, strong constraints in the dynamics or kinematics of the
robot, nor prescribing limb coordination. We provide supplemental videos for
qualitative analysis of the naturality of the learned gaits.
- Abstract(参考訳): 足の歩行を自然に再現する学習コントローラーは、ロボット工学とコンピュータグラフィックスの長年の目標だった。
有望な結果が得られる一方で、近年のアプローチは、異なる形態の脚系に適用できるほど柔軟ではない。
これは、しばしば、出現する歩行の自然性を保証するが一般化を防ぎながら、正確なモーションキャプチャ参照や精巧な学習環境に依存するためである。
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
強化学習(RL)の探索能力を活用して,安定かつ周期的な移動を維持するために必要なテンプレートモデルとフルボディダイナミックスとの間の情報ギャップを埋める制御ポリシーを学習する。
提案手法は大きさや形態の異なるロボットに適用でき、任意のRL技術や制御アーキテクチャに適用できる。
本研究は,モデルフリーの環境においても,2足歩行ロボットと4足歩行ロボットに対して,現実的でエネルギー効率のよい移動歩行を生成できることを実験的に示す。
そして最も重要なことは、これはモーションキャプチャやロボットの力学や運動学における強い制約、手足の調整を規定しないことだ。
学習歩行の自然性の質的分析のための補足ビデオを提供する。
関連論文リスト
- One Policy to Run Them All: an End-to-end Learning Approach to Multi-Embodiment Locomotion [18.556470359899855]
統一ロボット形態学アーキテクチャであるURMAを紹介する。
我々のフレームワークは、脚のあるロボットの領域にエンドツーエンドのマルチタスク強化学習アプローチをもたらす。
URMAはロボットプラットフォームに容易に移動可能な複数の実施形態の移動ポリシーを学習できることを示す。
論文 参考訳(メタデータ) (2024-09-10T09:44:15Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Learning Robust, Agile, Natural Legged Locomotion Skills in the Wild [17.336553501547282]
我々は、挑戦的な地形上で頑丈で、アジャイルで、自然な足の運動スキルを学ぶための新しいフレームワークを提案する。
四足歩行ロボットのシミュレーションと実世界における実証実験の結果,提案アルゴリズムは難易度の高い地形を頑健に横断できることを示した。
論文 参考訳(メタデータ) (2023-04-21T11:09:23Z) - GLiDE: Generalizable Quadrupedal Locomotion in Diverse Environments with
a Centroidal Model [18.66472547798549]
四足歩行のロバスト制御ポリシを生成するために,遠心モデルを用いてモデルフリー強化学習を効果的に利用できることを示す。
本手法は, ステップストーン移動, 2脚のインプレースバランス, バランスビーム移動, sim-to-real移動を, さらなる適応を伴わずに実現可能であることを示す。
論文 参考訳(メタデータ) (2021-04-20T05:55:13Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot
Dynamics and Environments [3.5309638744466167]
この研究は、ロバストな移動のための異なる条件に制御ポリシーを適応させるメタラーニングアプローチを開発した。
提案手法は, インタラクションモデルを更新し, 推定された状態-作用軌道のアクションをサンプル化し, 最適なアクションを適用し, 報酬を最大化する。
論文 参考訳(メタデータ) (2021-01-19T12:57:12Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。