論文の概要: Rapidly Adaptable Legged Robots via Evolutionary Meta-Learning
- arxiv url: http://arxiv.org/abs/2003.01239v3
- Date: Thu, 30 Jul 2020 00:22:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 04:13:38.049726
- Title: Rapidly Adaptable Legged Robots via Evolutionary Meta-Learning
- Title(参考訳): 進化的メタラーニングによる急速適応型レッグロボット
- Authors: Xingyou Song, Yuxiang Yang, Krzysztof Choromanski, Ken Caluwaerts,
Wenbo Gao, Chelsea Finn, Jie Tan
- Abstract要約: 本稿では,ロボットが動的変化に迅速に適応できるメタ学習手法を提案する。
提案手法は高雑音環境における動的変化への適応性を著しく改善する。
我々は、動的に変化しながら歩くことを学習する四足歩行ロボットに対するアプローチを検証する。
- 参考スコア(独自算出の注目度): 65.88200578485316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning adaptable policies is crucial for robots to operate autonomously in
our complex and quickly changing world. In this work, we present a new
meta-learning method that allows robots to quickly adapt to changes in
dynamics. In contrast to gradient-based meta-learning algorithms that rely on
second-order gradient estimation, we introduce a more noise-tolerant Batch
Hill-Climbing adaptation operator and combine it with meta-learning based on
evolutionary strategies. Our method significantly improves adaptation to
changes in dynamics in high noise settings, which are common in robotics
applications. We validate our approach on a quadruped robot that learns to walk
while subject to changes in dynamics. We observe that our method significantly
outperforms prior gradient-based approaches, enabling the robot to adapt its
policy to changes based on less than 3 minutes of real data.
- Abstract(参考訳): ロボットが複雑で急速に変化する世界で自律的に動くためには、適応可能なポリシーを学ぶことが不可欠だ。
本研究では,ロボットが動的変化に迅速に適応できるメタ学習手法を提案する。
二階勾配推定に依存する勾配に基づくメタラーニングアルゴリズムとは対照的に,より雑音耐性の高いバッチヒルクライミング適応演算子を導入し,進化戦略に基づくメタラーニングと組み合わせる。
本手法は,ロボット工学に共通する高騒音環境における動的変化への適応性を大幅に向上させる。
我々は,歩行を学習する四足歩行ロボットのアプローチを,ダイナミクスの変化に照らし合わせて検証する。
本手法は,先行する勾配に基づくアプローチを著しく上回っており,実際の3分未満のデータに基づいて,その方針を変化に適応させることができる。
関連論文リスト
- Research on Autonomous Robots Navigation based on Reinforcement Learning [13.559881645869632]
我々は、経路計画と意思決定プロセスを最適化するために、Deep Q Network (DQN) と Proximal Policy Optimization (PPO) モデルを使用します。
様々な複雑なシナリオにおいて,これらのモデルの有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2024-07-02T00:44:06Z) - Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment [92.48012013825988]
展開中のシナリオにオンザフライで適応する問題について検討する。
ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。
ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
論文 参考訳(メタデータ) (2023-11-02T08:22:28Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Synaptic motor adaptation: A three-factor learning rule for adaptive
robotic control in spiking neural networks [0.0]
本稿では、四足歩行ロボットにおけるリアルタイムオンライン適応を実現するための新しいアプローチであるSynaptic Motor Adaptation (SMA)アルゴリズムを提案する。
本アルゴリズムは最先端のモータ適応アルゴリズムと同様に動作し,ニューロモルフィックハードウェアを用いた適応ロボットの実現に向けた明確な道筋を示す。
論文 参考訳(メタデータ) (2023-06-02T20:31:33Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Never Stop Learning: The Effectiveness of Fine-Tuning in Robotic
Reinforcement Learning [109.77163932886413]
本稿では,ロボットによるロボット操作ポリシーを,政治以外の強化学習を通じて微調整することで,新たなバリエーションに適応する方法を示す。
この適応は、タスクをゼロから学習するために必要なデータの0.2%未満を使用する。
事前訓練されたポリシーを適用するという私たちのアプローチは、微調整の過程で大きなパフォーマンス向上につながります。
論文 参考訳(メタデータ) (2020-04-21T17:57:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。