論文の概要: Towards Continual Reinforcement Learning for Quadruped Robots
- arxiv url: http://arxiv.org/abs/2311.06828v1
- Date: Sun, 12 Nov 2023 12:54:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 16:41:06.619049
- Title: Towards Continual Reinforcement Learning for Quadruped Robots
- Title(参考訳): 四足歩行ロボットの連続強化学習に向けて
- Authors: Giovanni Minelli and Vassilis Vassiliades
- Abstract要約: 本研究は,四足歩行ロボットが展開後も学習を継続できる可能性を探るものである。
我々は2つの連続学習シナリオを設計し、異なる環境下でロボットを逐次訓練し、その性能を同時に評価する。
われわれのアプローチは、前向きと後向きの両方のスキル伝達の程度と、ロボットが以前獲得したスキルを忘れる程度に光を当てている。
- 参考スコア(独自算出の注目度): 1.9580473532948401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quadruped robots have emerged as an evolving technology that currently
leverages simulators to develop a robust controller capable of functioning in
the real-world without the need for further training. However, since it is
impossible to predict all possible real-world situations, our research explores
the possibility of enabling them to continue learning even after their
deployment. To this end, we designed two continual learning scenarios,
sequentially training the robot on different environments while simultaneously
evaluating its performance across all of them. Our approach sheds light on the
extent of both forward and backward skill transfer, as well as the degree to
which the robot might forget previously acquired skills. By addressing these
factors, we hope to enhance the adaptability and performance of quadruped
robots in real-world scenarios.
- Abstract(参考訳): 四足歩行ロボットは、現在シミュレーターを利用して、さらなる訓練を必要とせずに現実世界で機能するロバストなコントローラーを開発する進化する技術として登場している。
しかし,実世界のあらゆる状況を予測することは不可能であるため,本研究では,展開後も学習を継続できる可能性を探究する。
そこで我々は,2つの連続学習シナリオを設計し,ロボットを異なる環境で順次訓練し,その性能を同時に評価した。
われわれのアプローチは、前向きと後向きの両方のスキル伝達の程度と、ロボットが以前獲得したスキルを忘れる程度に光を当てている。
これらの要因に対処することで、現実のシナリオにおける四足ロボットの適応性と性能の向上を期待する。
関連論文リスト
- Bridging Active Exploration and Uncertainty-Aware Deployment Using
Probabilistic Ensemble Neural Network Dynamics [11.946807588018595]
本稿では,活発な探索と不確実性を考慮した展開を橋渡しするモデルベース強化学習フレームワークを提案する。
探索と展開の対立する2つのタスクは、最先端のサンプリングベースのMPCによって最適化されている。
自動運転車と車輪付きロボットの両方で実験を行い、探索と展開の両方に有望な結果を示します。
論文 参考訳(メタデータ) (2023-05-20T17:20:12Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot
Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。
本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文 参考訳(メタデータ) (2022-04-15T08:12:15Z) - Dual-Arm Adversarial Robot Learning [0.6091702876917281]
ロボット学習のためのプラットフォームとしてデュアルアーム設定を提案する。
このセットアップの潜在的なメリットと、追求できる課題と研究の方向性について論じる。
論文 参考訳(メタデータ) (2021-10-15T12:51:57Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Low Dimensional State Representation Learning with Robotics Priors in
Continuous Action Spaces [8.692025477306212]
強化学習アルゴリズムは、エンドツーエンドで複雑なロボティクスタスクを解くことができることが証明されている。
本稿では,ロボットの生の知覚情報から得られる高次元の観察から,低次元状態表現の学習と最適ポリシーの学習を組み合わせた枠組みを提案する。
論文 参考訳(メタデータ) (2021-07-04T15:42:01Z) - Learning Locomotion Skills in Evolvable Robots [10.167123492952694]
本稿では,任意の形状のモジュール型ロボットが目標に向かって歩いたり,移動した場合にこの目標に従うことを学習できるようにするための,コントローラアーキテクチャと汎用学習手法を提案する。
我々のアプローチは、現実世界の3つのシナリオにおいて、クモ、ヤモリ、そしてその子孫の3つのロボットに対して検証されている。
論文 参考訳(メタデータ) (2020-10-19T14:01:50Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。