論文の概要: Towards General and Autonomous Learning of Core Skills: A Case Study in
Locomotion
- arxiv url: http://arxiv.org/abs/2008.12228v1
- Date: Thu, 6 Aug 2020 08:23:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 06:26:54.298715
- Title: Towards General and Autonomous Learning of Core Skills: A Case Study in
Locomotion
- Title(参考訳): コアスキルの総合的・自律的学習に向けて:ロコモーションを事例として
- Authors: Roland Hafner, Tim Hertweck, Philipp Kl\"oppner, Michael Bloesch,
Michael Neunert, Markus Wulfmeier, Saran Tunyasuvunakool, Nicolas Heess,
Martin Riedmiller
- Abstract要約: 我々は,足の広いロボットに対して,洗練された移動動作を学習できる学習フレームワークを開発した。
我々の学習フレームワークは、データ効率のよいマルチタスクRLアルゴリズムと、ロボット間で意味論的に同一の報酬関数のセットに依存している。
現実世界の四足ロボットを含む9種類のロボットに対して、同じアルゴリズムが、多種多様な再利用可能な運動スキルを迅速に学習できることを実証する。
- 参考スコア(独自算出の注目度): 19.285099263193622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern Reinforcement Learning (RL) algorithms promise to solve difficult
motor control problems directly from raw sensory inputs. Their attraction is
due in part to the fact that they can represent a general class of methods that
allow to learn a solution with a reasonably set reward and minimal prior
knowledge, even in situations where it is difficult or expensive for a human
expert. For RL to truly make good on this promise, however, we need algorithms
and learning setups that can work across a broad range of problems with minimal
problem specific adjustments or engineering. In this paper, we study this idea
of generality in the locomotion domain. We develop a learning framework that
can learn sophisticated locomotion behavior for a wide spectrum of legged
robots, such as bipeds, tripeds, quadrupeds and hexapods, including wheeled
variants. Our learning framework relies on a data-efficient, off-policy
multi-task RL algorithm and a small set of reward functions that are
semantically identical across robots. To underline the general applicability of
the method, we keep the hyper-parameter settings and reward definitions
constant across experiments and rely exclusively on on-board sensing. For nine
different types of robots, including a real-world quadruped robot, we
demonstrate that the same algorithm can rapidly learn diverse and reusable
locomotion skills without any platform specific adjustments or additional
instrumentation of the learning setup.
- Abstract(参考訳): 現代の強化学習(RL)アルゴリズムは、生の感覚入力から直接、難しい運動制御問題を解くことを約束する。
彼らの魅力は、人間の専門家にとって困難または費用のかかる状況でも、合理的に設定された報酬と最小限の事前知識でソリューションを学ぶことができる一般的な方法のクラスを表現できるという事実にある。
しかし、RLがこの約束を真に達成するためには、問題固有の調整やエンジニアリングを最小限に抑えて幅広い問題に対処できるアルゴリズムと学習のセットアップが必要です。
本稿では,移動領域における一般性の概念について考察する。
そこで我々は,二足歩行,三足歩行,四足歩行,六足歩行など多種多様な歩行動作を学習する学習フレームワークを開発した。
我々の学習フレームワークは,データ効率のよいマルチタスクRLアルゴリズムと,ロボット間で意味論的に同一の報酬関数セットに依存している。
本手法の適用性を高めるため,実験中におけるハイパーパラメータ設定と報酬定義を一定に保ち,オンボードセンシングにのみ依存する。
実世界の四足歩行ロボットを含む9種類のロボットに対して、同じアルゴリズムがプラットフォーム固有の調整や学習装置の追加なしに、多種多様な再利用可能な運動スキルを迅速に学習できることを実証する。
関連論文リスト
- Multi-Objective Algorithms for Learning Open-Ended Robotic Problems [1.0124625066746598]
四足歩行は、自動運転車の普及に不可欠な複雑でオープンな問題である。
従来の強化学習アプローチは、トレーニングの不安定性とサンプルの非効率のため、しばしば不足する。
自動カリキュラム学習機構として多目的進化アルゴリズムを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-11T16:26:42Z) - One Policy to Run Them All: an End-to-end Learning Approach to Multi-Embodiment Locomotion [18.556470359899855]
統一ロボット形態学アーキテクチャであるURMAを紹介する。
我々のフレームワークは、脚のあるロボットの領域にエンドツーエンドのマルチタスク強化学習アプローチをもたらす。
URMAはロボットプラットフォームに容易に移動可能な複数の実施形態の移動ポリシーを学習できることを示す。
論文 参考訳(メタデータ) (2024-09-10T09:44:15Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Decentralized Motor Skill Learning for Complex Robotic Systems [5.669790037378093]
本稿では,分散モータスキル(DEMOS)学習アルゴリズムを提案する。
本手法は, 性能を犠牲にすることなく, 政策の堅牢性と一般化を向上する。
四足歩行ロボットとヒューマノイドロボットの実験は、学習方針が局所的な運動障害に対して堅牢であり、新しいタスクに移行できることを示した。
論文 参考訳(メタデータ) (2023-06-30T05:55:34Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - Accelerating Robotic Reinforcement Learning via Parameterized Action
Primitives [92.0321404272942]
強化学習は汎用ロボットシステムの構築に使用することができる。
しかし、ロボット工学の課題を解決するためにRLエージェントを訓練することは依然として困難である。
本研究では,ロボット行動プリミティブ(RAPS)のライブラリを手動で指定し,RLポリシーで学習した引数をパラメータ化する。
動作インターフェースへの簡単な変更は、学習効率とタスクパフォーマンスの両方を大幅に改善する。
論文 参考訳(メタデータ) (2021-10-28T17:59:30Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z) - Learning to Walk in the Real World with Minimal Human Effort [80.7342153519654]
我々は,人間の努力を最小限に抑えて,現実世界の深いRLを用いた足の移動ポリシーを学習するシステムを開発した。
人間の介入がほとんどないミニチュアロボットにおいて,ロボットの移動スキルを自動的かつ効率的に学習することができる。
論文 参考訳(メタデータ) (2020-02-20T03:36:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。