論文の概要: AMP in the wild: Learning robust, agile, natural legged locomotion
skills
- arxiv url: http://arxiv.org/abs/2304.10888v1
- Date: Fri, 21 Apr 2023 11:09:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-24 15:02:16.087282
- Title: AMP in the wild: Learning robust, agile, natural legged locomotion
skills
- Title(参考訳): amp in the wild: 堅牢でアジャイル、自然な足の歩行スキルを学ぶ
- Authors: Yikai Wang, Zheyuan Jiang, Jianyu Chen
- Abstract要約: 本研究では,動的システムのパラメータに関する情報だけでなく,ロボットの状態に関する重要な情報を過去の観測から推定できる新しいアルゴリズムを提案する。
我々は,我々のアルゴリズムをAdversarial Motion Priorsと統合し,実世界のUnitree A1四足ロボットとシミュレーションの両方において,堅牢でアジャイルで自然な歩行を実現する。
- 参考スコア(独自算出の注目度): 8.730572142445826
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The successful transfer of a learned controller from simulation to the real
world for a legged robot requires not only the ability to identify the system,
but also accurate estimation of the robot's state. In this paper, we propose a
novel algorithm that can infer not only information about the parameters of the
dynamic system, but also estimate important information about the robot's state
from previous observations. We integrate our algorithm with Adversarial Motion
Priors and achieve a robust, agile, and natural gait in both simulation and on
a Unitree A1 quadruped robot in the real world. Empirical results demonstrate
that our proposed algorithm enables traversing challenging terrains with lower
power consumption compared to the baselines. Both qualitative and quantitative
results are presented in this paper.
- Abstract(参考訳): ロボットのシミュレーションから実世界への学習コントローラの移動に成功するためには,システムを特定するだけでなく,ロボットの状態の正確な推定も必要である。
本稿では,動的システムのパラメータに関する情報を推測するだけでなく,過去の観測からロボットの状態に関する重要な情報を推定するアルゴリズムを提案する。
我々は,我々のアルゴリズムをAdversarial Motion Priorsと統合し,実世界のUnitree A1四足ロボットとシミュレーションの両方において,堅牢でアジャイルで自然な歩行を実現する。
実験により,提案アルゴリズムは,ベースラインに比べて消費電力の少ない挑戦的な地形をトラバースできることを示した。
本稿では質的および定量的な結果について述べる。
関連論文リスト
- Infer and Adapt: Bipedal Locomotion Reward Learning from Demonstrations
via Inverse Reinforcement Learning [5.246548532908499]
本稿では、複雑な地形上の二足歩行問題を解決するために、最先端の逆強化学習(IRL)技術を導入する。
専門家の報酬関数を学習するためのアルゴリズムを提案し、その後、学習関数を解析する。
両足歩行ポリシーを推定報酬関数で訓練することで、視認できない地形での歩行性能が向上することが実証的に実証された。
論文 参考訳(メタデータ) (2023-09-28T00:11:06Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文 参考訳(メタデータ) (2021-10-28T10:14:47Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z) - Emergent Real-World Robotic Skills via Unsupervised Off-Policy
Reinforcement Learning [81.12201426668894]
報奨関数を使わずに多様なスキルを習得し,これらのスキルを下流のタスクに再利用する効率的な強化学習手法を開発した。
提案アルゴリズムは学習効率を大幅に向上させ,報酬のない実世界のトレーニングを実現する。
また,学習スキルは,目標指向ナビゲーションのためのモデル予測制御を用いて,追加のトレーニングを伴わずに構成可能であることも実証した。
論文 参考訳(メタデータ) (2020-04-27T17:38:53Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。