論文の概要: Meta-Evolve: Continuous Robot Evolution for One-to-many Policy Transfer
- arxiv url: http://arxiv.org/abs/2405.03534v1
- Date: Mon, 6 May 2024 14:52:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-07 13:26:55.498298
- Title: Meta-Evolve: Continuous Robot Evolution for One-to-many Policy Transfer
- Title(参考訳): Meta-Evolve: 一対多政策伝達のための連続ロボット進化
- Authors: Xingyu Liu, Deepak Pathak, Ding Zhao,
- Abstract要約: 本研究では, 連続ロボットの進化を利用して, 各目標ロボットに効率よくポリシーを伝達する手法を提案する。
ロボット進化ツリーは、ロボット進化経路の共有を可能にするため、我々のアプローチは1対1のポリシー伝達を大幅に上回る。
- 参考スコア(独自算出の注目度): 68.10957584496866
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We investigate the problem of transferring an expert policy from a source robot to multiple different robots. To solve this problem, we propose a method named $Meta$-$Evolve$ that uses continuous robot evolution to efficiently transfer the policy to each target robot through a set of tree-structured evolutionary robot sequences. The robot evolution tree allows the robot evolution paths to be shared, so our approach can significantly outperform naive one-to-one policy transfer. We present a heuristic approach to determine an optimized robot evolution tree. Experiments have shown that our method is able to improve the efficiency of one-to-three transfer of manipulation policy by up to 3.2$\times$ and one-to-six transfer of agile locomotion policy by 2.4$\times$ in terms of simulation cost over the baseline of launching multiple independent one-to-one policy transfers.
- Abstract(参考訳): 本稿では,ソースロボットから複数の異なるロボットに専門家ポリシーを転送する問題について検討する。
そこで本研究では,連続ロボット進化を利用して,木構造進化ロボットの集合を通して,各対象ロボットに効率的にポリシーを伝達する,Meta$-$Evolve$という手法を提案する。
ロボット進化ツリーは、ロボット進化経路の共有を可能にするため、我々のアプローチは1対1のポリシー伝達を大幅に上回る。
最適化されたロボット進化木を決定するためのヒューリスティックなアプローチを提案する。
実験の結果,操作方針の1対3の転送効率を最大3.2$\times$と1対6のアジャイルロコモーション政策の2.4$\times$で改善できることが判明した。
関連論文リスト
- Polybot: Training One Policy Across Robots While Embracing Variability [70.74462430582163]
複数のロボットプラットフォームにデプロイするための単一のポリシーをトレーニングするための重要な設計決定セットを提案する。
われわれのフレームワークは、まず、手首カメラを利用して、我々のポリシーの観察空間と行動空間を具体化して調整する。
6つのタスクと3つのロボットにまたがる60時間以上のデータセットを用いて,関節の形状や大きさの異なるデータセットの評価を行った。
論文 参考訳(メタデータ) (2023-07-07T17:21:16Z) - Expanding Versatility of Agile Locomotion through Policy Transitions
Using Latent State Representation [3.8271803328378677]
本研究では,現実の環境下でのロボット移動の汎用性を高めるためのロバストな遷移戦略を提案する。
我々のアプローチは実世界で有効であり、我々の実験において最も挑戦的な遷移ペアの平均成功率は19%に達する。
論文 参考訳(メタデータ) (2023-06-14T03:30:04Z) - Human-Robot Skill Transfer with Enhanced Compliance via Dynamic Movement
Primitives [1.7901837062462316]
本研究では,動的運動プリミティブ(Dynamic Movement Primitives)フレームワークにおいて,人間の実演から動的特徴を抽出し,パラメータを自動チューニングする体系的手法を提案する。
本手法は,LfDとRLの両方に追従するロボット軌道を再現するために,人間の動的特徴を抽出するための実際のロボット装置に実装した。
論文 参考訳(メタデータ) (2023-04-12T08:48:28Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - Rapidly Adaptable Legged Robots via Evolutionary Meta-Learning [65.88200578485316]
本稿では,ロボットが動的変化に迅速に適応できるメタ学習手法を提案する。
提案手法は高雑音環境における動的変化への適応性を著しく改善する。
我々は、動的に変化しながら歩くことを学習する四足歩行ロボットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-03-02T22:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。