論文の概要: Towards Continual Reinforcement Learning for Quadruped Robots
- arxiv url: http://arxiv.org/abs/2311.06828v1
- Date: Sun, 12 Nov 2023 12:54:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 16:41:06.619049
- Title: Towards Continual Reinforcement Learning for Quadruped Robots
- Title(参考訳): 四足歩行ロボットの連続強化学習に向けて
- Authors: Giovanni Minelli and Vassilis Vassiliades
- Abstract要約: 本研究は,四足歩行ロボットが展開後も学習を継続できる可能性を探るものである。
我々は2つの連続学習シナリオを設計し、異なる環境下でロボットを逐次訓練し、その性能を同時に評価する。
われわれのアプローチは、前向きと後向きの両方のスキル伝達の程度と、ロボットが以前獲得したスキルを忘れる程度に光を当てている。
- 参考スコア(独自算出の注目度): 1.9580473532948401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quadruped robots have emerged as an evolving technology that currently
leverages simulators to develop a robust controller capable of functioning in
the real-world without the need for further training. However, since it is
impossible to predict all possible real-world situations, our research explores
the possibility of enabling them to continue learning even after their
deployment. To this end, we designed two continual learning scenarios,
sequentially training the robot on different environments while simultaneously
evaluating its performance across all of them. Our approach sheds light on the
extent of both forward and backward skill transfer, as well as the degree to
which the robot might forget previously acquired skills. By addressing these
factors, we hope to enhance the adaptability and performance of quadruped
robots in real-world scenarios.
- Abstract(参考訳): 四足歩行ロボットは、現在シミュレーターを利用して、さらなる訓練を必要とせずに現実世界で機能するロバストなコントローラーを開発する進化する技術として登場している。
しかし,実世界のあらゆる状況を予測することは不可能であるため,本研究では,展開後も学習を継続できる可能性を探究する。
そこで我々は,2つの連続学習シナリオを設計し,ロボットを異なる環境で順次訓練し,その性能を同時に評価した。
われわれのアプローチは、前向きと後向きの両方のスキル伝達の程度と、ロボットが以前獲得したスキルを忘れる程度に光を当てている。
これらの要因に対処することで、現実のシナリオにおける四足ロボットの適応性と性能の向上を期待する。
関連論文リスト
- Towards General Purpose Robots at Scale: Lifelong Learning and Learning to Use Memory [0.0]
このテーマは、記憶と生涯学習という、長い時間をかけて動くロボットにとっての2つの重要な課題に対処することに焦点を当てている。
まず,連続世界ベンチマークにおける最先端性能を実現するトラジェクトリベースディープ生成再生法であるt-DGRを紹介する。
第2に,人間の実演を利用してエージェントに効果的なメモリ利用を教えるフレームワークを開発する。
論文 参考訳(メタデータ) (2024-12-28T21:13:48Z) - A Retrospective on the Robot Air Hockey Challenge: Benchmarking Robust, Reliable, and Safe Learning Techniques for Real-world Robotics [53.33976793493801]
私たちは、NeurIPS 2023カンファレンスでRobot Air Hockey Challengeを組織しました。
我々は、シム・トゥ・リアルギャップ、低レベルの制御問題、安全性問題、リアルタイム要件、実世界のデータの限られた可用性など、ロボット工学における実践的な課題に焦点を当てる。
その結果、学習に基づくアプローチと事前知識を組み合わせたソリューションは、実際のデプロイメントが困難である場合にデータのみに依存するソリューションよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-11-08T17:20:47Z) - Generalized Robot Learning Framework [10.03174544844559]
本稿では,様々なロボットや環境に容易に再現可能かつ伝達可能な,低コストなロボット学習フレームワークを提案する。
我々は,産業用ロボットにおいても,デプロイ可能な模倣学習をうまく適用できることを実証した。
論文 参考訳(メタデータ) (2024-09-18T15:34:31Z) - Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文 参考訳(メタデータ) (2024-07-02T21:00:30Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot
Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。
本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文 参考訳(メタデータ) (2022-04-15T08:12:15Z) - Dual-Arm Adversarial Robot Learning [0.6091702876917281]
ロボット学習のためのプラットフォームとしてデュアルアーム設定を提案する。
このセットアップの潜在的なメリットと、追求できる課題と研究の方向性について論じる。
論文 参考訳(メタデータ) (2021-10-15T12:51:57Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Low Dimensional State Representation Learning with Robotics Priors in
Continuous Action Spaces [8.692025477306212]
強化学習アルゴリズムは、エンドツーエンドで複雑なロボティクスタスクを解くことができることが証明されている。
本稿では,ロボットの生の知覚情報から得られる高次元の観察から,低次元状態表現の学習と最適ポリシーの学習を組み合わせた枠組みを提案する。
論文 参考訳(メタデータ) (2021-07-04T15:42:01Z) - Learning Locomotion Skills in Evolvable Robots [10.167123492952694]
本稿では,任意の形状のモジュール型ロボットが目標に向かって歩いたり,移動した場合にこの目標に従うことを学習できるようにするための,コントローラアーキテクチャと汎用学習手法を提案する。
我々のアプローチは、現実世界の3つのシナリオにおいて、クモ、ヤモリ、そしてその子孫の3つのロボットに対して検証されている。
論文 参考訳(メタデータ) (2020-10-19T14:01:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。