論文の概要: Expanding Versatility of Agile Locomotion through Policy Transitions
Using Latent State Representation
- arxiv url: http://arxiv.org/abs/2306.08224v1
- Date: Wed, 14 Jun 2023 03:30:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-16 20:35:48.178093
- Title: Expanding Versatility of Agile Locomotion through Policy Transitions
Using Latent State Representation
- Title(参考訳): 潜在状態表現を用いた政策移行によるアジャイルロコモーションの汎用性の拡大
- Authors: Guilherme Christmann, Ying-Sheng Luo, Jonathan Hans Soeseno, Wei-Chao
Chen
- Abstract要約: 本研究では,現実の環境下でのロボット移動の汎用性を高めるためのロバストな遷移戦略を提案する。
我々のアプローチは実世界で有効であり、我々の実験において最も挑戦的な遷移ペアの平均成功率は19%に達する。
- 参考スコア(独自算出の注目度): 3.8271803328378677
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper proposes the transition-net, a robust transition strategy that
expands the versatility of robot locomotion in the real-world setting. To this
end, we start by distributing the complexity of different gaits into dedicated
locomotion policies applicable to real-world robots. Next, we expand the
versatility of the robot by unifying the policies with robust transitions into
a single coherent meta-controller by examining the latent state
representations. Our approach enables the robot to iteratively expand its skill
repertoire and robustly transition between any policy pair in a library. In our
framework, adding new skills does not introduce any process that alters the
previously learned skills. Moreover, training of a locomotion policy takes less
than an hour with a single consumer GPU. Our approach is effective in the
real-world and achieves a 19% higher average success rate for the most
challenging transition pairs in our experiments compared to existing
approaches.
- Abstract(参考訳): 本稿では,実環境におけるロボット移動の汎用性を高めるロバストな遷移戦略であるtransition-netを提案する。
この目的のために、我々は異なる歩行の複雑さを現実世界のロボットに適用可能な専用の移動ポリシーに分散することから始める。
次に、ロバストな遷移を伴うポリシーを、潜在状態表現を調べることによって単一のコヒーレントなメタコントローラに統一することにより、ロボットの汎用性を拡大する。
本手法により,ロボットはリパートリーを反復的に拡張し,ライブラリ内の任意のポリシーペア間の堅牢な遷移を可能にする。
我々のフレームワークでは、新しいスキルを追加することは、以前に学んだスキルを変えるプロセスを導入しない。
さらに、locomotionポリシーのトレーニングには、1つのコンシューマgpuで1時間もかからない。
我々のアプローチは実世界で有効であり、既存のアプローチに比べて実験において最も困難な移行ペアの平均成功率は19%高い。
関連論文リスト
- One Policy to Run Them All: an End-to-end Learning Approach to Multi-Embodiment Locomotion [18.556470359899855]
統一ロボット形態学アーキテクチャであるURMAを紹介する。
我々のフレームワークは、脚のあるロボットの領域にエンドツーエンドのマルチタスク強化学習アプローチをもたらす。
URMAはロボットプラットフォームに容易に移動可能な複数の実施形態の移動ポリシーを学習できることを示す。
論文 参考訳(メタデータ) (2024-09-10T09:44:15Z) - Meta-Evolve: Continuous Robot Evolution for One-to-many Policy Transfer [68.10957584496866]
本研究では, 連続ロボットの進化を利用して, 各目標ロボットに効率よくポリシーを伝達する手法を提案する。
ロボット進化ツリーは、ロボット進化経路の共有を可能にするため、我々のアプローチは1対1のポリシー伝達を大幅に上回る。
論文 参考訳(メタデータ) (2024-05-06T14:52:23Z) - Distilling Reinforcement Learning Policies for Interpretable Robot Locomotion: Gradient Boosting Machines and Symbolic Regression [53.33734159983431]
本稿では, ニューラルRLポリシをより解釈可能な形式に蒸留する新しい手法を提案する。
我々は、RLを用いて専門家のニューラルネットワークポリシーを訓練し、(i)GBM、(ii)EBM、(iii)シンボリックポリシーに蒸留する。
論文 参考訳(メタデータ) (2024-03-21T11:54:45Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Advanced Skills by Learning Locomotion and Local Navigation End-to-End [10.872193480485596]
本研究は, 深層強化学習によるエンドツーエンド政策の訓練により, 完全な問題を解決することを提案する。
実際の四足歩行ロボットにおけるポリシーの展開を実演する。
論文 参考訳(メタデータ) (2022-09-26T16:35:00Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文 参考訳(メタデータ) (2021-10-28T10:14:47Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Rapidly Adaptable Legged Robots via Evolutionary Meta-Learning [65.88200578485316]
本稿では,ロボットが動的変化に迅速に適応できるメタ学習手法を提案する。
提案手法は高雑音環境における動的変化への適応性を著しく改善する。
我々は、動的に変化しながら歩くことを学習する四足歩行ロボットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-03-02T22:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。