論文の概要: Learning Agile Robotic Locomotion Skills by Imitating Animals
- arxiv url: http://arxiv.org/abs/2004.00784v3
- Date: Tue, 21 Jul 2020 00:59:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 13:13:00.480184
- Title: Learning Agile Robotic Locomotion Skills by Imitating Animals
- Title(参考訳): 動物を駆使したアジャイルロボットのロコモーションスキルの学習
- Authors: Xue Bin Peng, Erwin Coumans, Tingnan Zhang, Tsang-Wei Lee, Jie Tan,
Sergey Levine
- Abstract要約: 動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
- 参考スコア(独自算出の注目度): 72.36395376558984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reproducing the diverse and agile locomotion skills of animals has been a
longstanding challenge in robotics. While manually-designed controllers have
been able to emulate many complex behaviors, building such controllers involves
a time-consuming and difficult development process, often requiring substantial
expertise of the nuances of each skill. Reinforcement learning provides an
appealing alternative for automating the manual effort involved in the
development of controllers. However, designing learning objectives that elicit
the desired behaviors from an agent can also require a great deal of
skill-specific expertise. In this work, we present an imitation learning system
that enables legged robots to learn agile locomotion skills by imitating
real-world animals. We show that by leveraging reference motion data, a single
learning-based approach is able to automatically synthesize controllers for a
diverse repertoire behaviors for legged robots. By incorporating sample
efficient domain adaptation techniques into the training process, our system is
able to learn adaptive policies in simulation that can then be quickly adapted
for real-world deployment. To demonstrate the effectiveness of our system, we
train an 18-DoF quadruped robot to perform a variety of agile behaviors ranging
from different locomotion gaits to dynamic hops and turns.
- Abstract(参考訳): 動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
手動で設計したコントローラは多くの複雑な動作をエミュレートできるが、このようなコントローラの構築には時間がかかり、開発プロセスが困難で、各スキルのニュアンスに十分な専門知識を必要とすることが多い。
強化学習は、コントローラの開発に関わる手動作業を自動化するための魅力的な代替手段を提供する。
しかし、エージェントから望ましい行動を引き出す学習目標を設計するには、多くのスキル固有の専門知識が必要である。
本研究では,実世界の動物を模倣して,足のロボットがアジャイルな運動スキルを習得できる模擬学習システムを提案する。
本研究では,レファレンス動作データを活用することで,脚型ロボットの多種多様なレパートリー動作に対するコントローラの自動合成を実現する。
サンプル効率の良いドメイン適応手法をトレーニングプロセスに組み込むことで,本システムは実世界の展開に迅速に適応できるシミュレーションの適応ポリシーを学習することができる。
システムの有効性を実証するため,我々は18-DoF四足歩行ロボットを訓練し,異なる移動歩行から動的ホップ,ターンに至るまで,様々なアジャイル行動を実行する。
関連論文リスト
- Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Generalized Animal Imitator: Agile Locomotion with Versatile Motion Prior [14.114972332185044]
本稿では,様々なアジャイルロコモーションタスクを組み込んだ強化学習フレームワークであるVersatile Motion Prior (VIM)を紹介する。
本フレームワークは,動物の動作や手作業による動作を模倣することにより,多様なアジャイルの低レベルスキルを学習することを可能にする。
シミュレーション環境と実環境の両方にまたがるVIMフレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-10-02T17:59:24Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Adaptation of Quadruped Robot Locomotion with Meta-Learning [64.71260357476602]
本研究では,多岐にわたる移動課題を解くロボットの訓練にメタ強化学習を用いることを実証する。
メタトレーニングロボットのパフォーマンスは、単一のタスクでトレーニングされたロボットと似ている。
論文 参考訳(メタデータ) (2021-07-08T10:37:18Z) - Towards General and Autonomous Learning of Core Skills: A Case Study in
Locomotion [19.285099263193622]
我々は,足の広いロボットに対して,洗練された移動動作を学習できる学習フレームワークを開発した。
我々の学習フレームワークは、データ効率のよいマルチタスクRLアルゴリズムと、ロボット間で意味論的に同一の報酬関数のセットに依存している。
現実世界の四足ロボットを含む9種類のロボットに対して、同じアルゴリズムが、多種多様な再利用可能な運動スキルを迅速に学習できることを実証する。
論文 参考訳(メタデータ) (2020-08-06T08:23:55Z) - Learning Agile Locomotion via Adversarial Training [59.03007947334165]
本稿では,四足歩行ロボット(主人公)が他のロボット(敵)を追いかけるのを学習し,後者が逃げることを学習するマルチエージェント学習システムを提案する。
この敵対的なトレーニングプロセスは、アジャイルの振る舞いを促進するだけでなく、退屈な環境設計の努力を効果的に軽減します。
1つの敵のみを使用した以前の作品とは対照的に、異なる逃走戦略を専門とする敵のアンサンブルを訓練することは、主人公がアジリティを習得するために不可欠である。
論文 参考訳(メタデータ) (2020-08-03T01:20:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。