論文の概要: Efficient Learning of Locomotion Skills through the Discovery of Diverse
Environmental Trajectory Generator Priors
- arxiv url: http://arxiv.org/abs/2210.04819v1
- Date: Mon, 10 Oct 2022 16:31:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 14:03:02.629850
- Title: Efficient Learning of Locomotion Skills through the Discovery of Diverse
Environmental Trajectory Generator Priors
- Title(参考訳): 多様な環境軌道生成装置の事前発見によるロコモーションスキルの効率的な学習
- Authors: Shikha Surana, Bryan Lim, Antoine Cully
- Abstract要約: 環境軌道発電機(EETG)について
EETGは、Quality-Diversityアルゴリズムを使用して、さまざまな特殊な移動先を学習する。
実験の結果, 多様なTG事前学習は, 1つの固定された先行学習よりも有意に(5倍)効率が高いことがわかった。
- 参考スコア(独自算出の注目度): 4.788163807490196
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data-driven learning based methods have recently been particularly successful
at learning robust locomotion controllers for a variety of unstructured
terrains. Prior work has shown that incorporating good locomotion priors in the
form of trajectory generators (TGs) is effective at efficiently learning
complex locomotion skills. However, defining a good, single TG as
tasks/environments become increasingly more complex remains a challenging
problem as it requires extensive tuning and risks reducing the effectiveness of
the prior. In this paper, we present Evolved Environmental Trajectory
Generators (EETG), a method that learns a diverse set of specialised locomotion
priors using Quality-Diversity algorithms while maintaining a single policy
within the Policies Modulating TG (PMTG) architecture. The results demonstrate
that EETG enables a quadruped robot to successfully traverse a wide range of
environments, such as slopes, stairs, rough terrain, and balance beams. Our
experiments show that learning a diverse set of specialized TG priors is
significantly (5 times) more efficient than using a single, fixed prior when
dealing with a wide range of environments.
- Abstract(参考訳): データ駆動学習に基づく手法は最近、様々な非構造化地形に対するロコモーションコントローラの学習に特に成功している。
従来の研究は、軌道生成器(TG)の形で良好な移動先を組み込むことが、複雑な移動スキルを効率的に学習する上で有効であることが示されている。
しかしながら、タスク/環境がますます複雑になるにつれて、良いシングルtgを定義することは、広範なチューニングと、以前の効果を低下させるリスクを必要とするため、依然として困難な問題である。
本稿では,tgアーキテクチャを変調するポリシー内で単一のポリシーを維持しつつ,品質多様性アルゴリズムを用いて多様な特定ロコモーション前処理を学習する手法である環境軌道生成器(eetg)について述べる。
以上の結果から,4足歩行ロボットは斜面,階段,荒地,平均台などの広い範囲の環境を乗り越えることができることがわかった。
実験の結果,多種多様なTG事前学習は,幅広い環境を扱う場合において,単一の固定された事前学習よりも有意に(5倍)効率が高いことがわかった。
関連論文リスト
- Multi-Objective Algorithms for Learning Open-Ended Robotic Problems [1.0124625066746598]
四足歩行は、自動運転車の普及に不可欠な複雑でオープンな問題である。
従来の強化学習アプローチは、トレーニングの不安定性とサンプルの非効率のため、しばしば不足する。
自動カリキュラム学習機構として多目的進化アルゴリズムを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-11T16:26:42Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - MTAC: Hierarchical Reinforcement Learning-based Multi-gait
Terrain-adaptive Quadruped Controller [12.300578189051963]
動的・荒地環境における四足歩行ロボットの制御は、これらのロボットの自由度が高いため、難しい問題である。
現在の四足歩行制御装置は、複数の適応歩行を生産し、時間と資源効率のよい方法でタスクを解く能力に制限があり、面倒なトレーニングと手動のチューニング手順を必要とする。
時間とメモリ効率を両立させながら階層的強化学習(HRL)アプローチを利用するマルチゲット地形適応型コントローラMTACを提案する。
論文 参考訳(メタデータ) (2023-11-01T18:17:47Z) - Efficient Learning of High Level Plans from Play [57.29562823883257]
本稿では,移動計画と深いRLを橋渡しするロボット学習のフレームワークであるELF-Pについて紹介する。
ELF-Pは、複数の現実的な操作タスクよりも、関連するベースラインよりもはるかに優れたサンプル効率を有することを示す。
論文 参考訳(メタデータ) (2023-03-16T20:09:47Z) - Don't Start From Scratch: Leveraging Prior Data to Automate Robotic
Reinforcement Learning [70.70104870417784]
強化学習(RL)アルゴリズムは、ロボットシステムの自律的なスキル獲得を可能にするという約束を持っている。
現実のロボットRLは、通常、環境をリセットするためにデータ収集と頻繁な人間の介入を必要とする。
本研究では,従来のタスクから収集した多様なオフラインデータセットを効果的に活用することで,これらの課題にどのように対処できるかを検討する。
論文 参考訳(メタデータ) (2022-07-11T08:31:22Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Complex Locomotion Skill Learning via Differentiable Physics [30.868690308658174]
微分物理学は、ニューラルネットワーク(NN)コントローラの効率的な最適化を可能にする。
本稿では,複雑度と多様性を著しく向上したタスクが可能な統一NNコントローラを出力する実践的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-06T04:01:12Z) - Accelerating Robotic Reinforcement Learning via Parameterized Action
Primitives [92.0321404272942]
強化学習は汎用ロボットシステムの構築に使用することができる。
しかし、ロボット工学の課題を解決するためにRLエージェントを訓練することは依然として困難である。
本研究では,ロボット行動プリミティブ(RAPS)のライブラリを手動で指定し,RLポリシーで学習した引数をパラメータ化する。
動作インターフェースへの簡単な変更は、学習効率とタスクパフォーマンスの両方を大幅に改善する。
論文 参考訳(メタデータ) (2021-10-28T17:59:30Z) - Reinforcement Learning with Evolutionary Trajectory Generator: A General
Approach for Quadrupedal Locomotion [29.853927354893656]
進化的足跡生成器を含む新しいRLに基づくアプローチを提案する。
ジェネレータは、与えられたタスクの出力軌跡の形状を継続的に最適化し、ポリシー学習のガイドとなる多様な動作前を提供する。
我々は,12-DoF四足歩行ロボットのシミュレーションで学習したコントローラをデプロイし,効率の良い歩行で挑戦的なシナリオを横切ることに成功した。
論文 参考訳(メタデータ) (2021-09-14T02:51:50Z) - Evolutionary Gait Transfer of Multi-Legged Robots in Complex Terrains [14.787379075870383]
本稿では、Tr-GOと呼ばれる歩行最適化のための移動学習に基づく進化的フレームワークを提案する。
この考え方は、トランスファーラーニング技術を用いて高品質な人口を初期化することを目的としており、どんな集団ベースの最適化アルゴリズムでもこのフレームワークにシームレスに統合できる。
実験の結果,3つの多目的進化アルゴリズムに基づく歩行最適化問題に対する提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-12-24T16:41:36Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。