論文の概要: Advanced Skills through Multiple Adversarial Motion Priors in
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2203.14912v1
- Date: Wed, 23 Mar 2022 09:24:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-03 17:48:57.633963
- Title: Advanced Skills through Multiple Adversarial Motion Priors in
Reinforcement Learning
- Title(参考訳): 強化学習における複数対向運動の先駆的スキル
- Authors: Eric Vollenweider, Marko Bjelonic, Victor Klemm, Nikita Rudin, Joonho
Lee, Marco Hutter
- Abstract要約: 本稿では, 対向運動に基づく強化学習の概念を強化するためのアプローチを提案する。
複数のスタイルやスキルを,顕著なパフォーマンスの違いを伴わずに同時に学習できることが示される。
本手法は車輪付き四脚ロボットを用いた実世界実験で実証された。
- 参考スコア(独自算出の注目度): 10.445369597014533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, reinforcement learning (RL) has shown outstanding
performance for locomotion control of highly articulated robotic systems. Such
approaches typically involve tedious reward function tuning to achieve the
desired motion style. Imitation learning approaches such as adversarial motion
priors aim to reduce this problem by encouraging a pre-defined motion style. In
this work, we present an approach to augment the concept of adversarial motion
prior-based RL to allow for multiple, discretely switchable styles. We show
that multiple styles and skills can be learned simultaneously without notable
performance differences, even in combination with motion data-free skills. Our
approach is validated in several real-world experiments with a wheeled-legged
quadruped robot showing skills learned from existing RL controllers and
trajectory optimization, such as ducking and walking, and novel skills such as
switching between a quadrupedal and humanoid configuration. For the latter
skill, the robot is required to stand up, navigate on two wheels, and sit down.
Instead of tuning the sit-down motion, we verify that a reverse playback of the
stand-up movement helps the robot discover feasible sit-down behaviors and
avoids tedious reward function tuning.
- Abstract(参考訳): 近年、強化学習(RL)は高度に調音されたロボットシステムの移動制御に優れた性能を示している。
このようなアプローチは、通常、望ましい動作スタイルを達成するために退屈な報酬関数チューニングを伴う。
対向運動先行のような模倣学習アプローチは、事前に定義された動きスタイルを奨励することによってこの問題を軽減することを目的としている。
本研究では,複数の個別に切り替え可能なスタイルを実現するために,逆運動事前ベースRLの概念を拡大するアプローチを提案する。
動作データフリーのスキルと組み合わせても、顕著なパフォーマンスの違いなしに複数のスタイルやスキルを同時に学習できることが示される。
本手法は、既存のRLコントローラから学んだスキルと、ダッキングやウォーキングなどの軌道最適化、四足歩行とヒューマノイド構成の切り替えなどの新しいスキルを示す車輪付き四足ロボットを用いた実世界のいくつかの実験で検証された。
後者のスキルでは、ロボットは立ち上がり、2つの車輪で移動し、座る必要がある。
着席動作をチューニングするのではなく、スタンドアップ動作の逆再生がロボットの着席動作を検知し、退屈な報酬関数のチューニングを回避できることを確認します。
関連論文リスト
- Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Universal Humanoid Motion Representations for Physics-Based Control [71.46142106079292]
物理学に基づくヒューマノイド制御のための総合的な運動スキルを含む普遍的な運動表現を提案する。
まず、大きな非構造運動データセットから人間の動きをすべて模倣できる動き模倣機を学習する。
次に、模倣者から直接スキルを蒸留することで、動作表現を作成します。
論文 参考訳(メタデータ) (2023-10-06T20:48:43Z) - Generalized Animal Imitator: Agile Locomotion with Versatile Motion Prior [14.114972332185044]
本稿では,様々なアジャイルロコモーションタスクを組み込んだ強化学習フレームワークであるVersatile Motion Prior (VIM)を紹介する。
本フレームワークは,動物の動作や手作業による動作を模倣することにより,多様なアジャイルの低レベルスキルを学習することを可能にする。
シミュレーション環境と実環境の両方にまたがるVIMフレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-10-02T17:59:24Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Creating a Dynamic Quadrupedal Robotic Goalkeeper with Reinforcement
Learning [18.873152528330063]
本稿では,4足歩行ロボットが実世界でサッカーのゴールキーピングタスクを実行できる強化学習(RL)フレームワークを提案する。
四足歩行を用いたサッカーのゴールキーピングは難しい問題であり、非常にダイナミックな移動と、正確で高速な非包括的(ボール)操作を組み合わせたものである。
提案するフレームワークをMini Cheetah四脚ロボットにデプロイし,実世界における高速移動球のアジャイルインターセプションにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-10T04:54:55Z) - UniCon: Universal Neural Controller For Physics-based Character Motion [70.45421551688332]
大規模動作データセットから学習することで,異なるスタイルで数千の動作を習得する物理ベースのユニバーサルニューラルコントローラ(UniCon)を提案する。
UniConは、キーボード駆動制御をサポートし、ロコモーションとアクロバティックスキルの大きなプールから引き出されたモーションシーケンスを作成し、ビデオで撮影した人を物理ベースの仮想アバターにテレポートする。
論文 参考訳(メタデータ) (2020-11-30T18:51:16Z) - Learning Agile Locomotion via Adversarial Training [59.03007947334165]
本稿では,四足歩行ロボット(主人公)が他のロボット(敵)を追いかけるのを学習し,後者が逃げることを学習するマルチエージェント学習システムを提案する。
この敵対的なトレーニングプロセスは、アジャイルの振る舞いを促進するだけでなく、退屈な環境設計の努力を効果的に軽減します。
1つの敵のみを使用した以前の作品とは対照的に、異なる逃走戦略を専門とする敵のアンサンブルを訓練することは、主人公がアジリティを習得するために不可欠である。
論文 参考訳(メタデータ) (2020-08-03T01:20:37Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。