論文の概要: Task-free Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation
- arxiv url: http://arxiv.org/abs/2410.02995v3
- Date: Mon, 03 Feb 2025 12:08:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-04 16:04:00.514622
- Title: Task-free Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation
- Title(参考訳): 検索型重み付き局所適応を用いたタスクフリー生涯ロボット学習
- Authors: Pengzhi Yang, Xinyu Wang, Ruipeng Zhang, Cong Wang, Frans A. Oliehoek, Jens Kober,
- Abstract要約: 従来の課題から得たデータのサブセットを格納し,学習スキルを維持するために経験的リプレイを活用することと,関連する知識を回復するために新しい検索型局所適応技術を適用することの2つの方法により活用する。
我々はまた、最も「忘れられた」スキルセグメントに集中し、効果的な知識回復を確保するために、選択的な重み付け機構も組み込んだ。
- 参考スコア(独自算出の注目度): 17.215730187681952
- License:
- Abstract: A fundamental objective in intelligent robotics is to move towards lifelong learning robot that can learn and adapt to unseen scenarios over time. However, continually learning new tasks would introduce catastrophic forgetting problems due to data distribution shifts. To mitigate this, we store a subset of data from previous tasks and utilize it in two manners: leveraging experience replay to retain learned skills and applying a novel Retrieval-based Local Adaptation technique to restore relevant knowledge. Since a lifelong learning robot must operate in task-free scenarios, where task IDs and even boundaries are not available, our method performs effectively without relying on such information. We also incorporate a selective weighting mechanism to focus on the most "forgotten" skill segment, ensuring effective knowledge restoration. Experimental results across diverse manipulation tasks demonstrate that our framework provides a scalable paradigm for lifelong learning, enhancing robot performance in open-ended, task-free scenarios.
- Abstract(参考訳): インテリジェントロボティクスの基本的な目的は、生涯学習ロボットに移行し、時間の経過とともに目に見えないシナリオを学習し、適応できるようにすることである。
しかし、新しいタスクを継続的に学習することは、データの分散シフトによる破滅的な忘れの問題を引き起こすだろう。
これを軽減するために、我々は、過去のタスクからのデータのサブセットを格納し、学習スキルを維持するために経験リプレイを活用することと、関連する知識を回復するために、新しい検索ベースの局所適応技術を適用した2つの方法でそれを利用する。
生涯学習ロボットは,タスクIDや境界さえ利用できないタスクフリーのシナリオで動作しなければならないため,そのような情報に頼ることなく効果的に動作することができる。
我々はまた、最も「忘れられた」スキルセグメントに集中し、効果的な知識回復を確保するために、選択的な重み付け機構も組み込んだ。
多様な操作タスクにまたがる実験結果から、我々のフレームワークは生涯学習にスケーラブルなパラダイムを提供し、オープンエンドのタスクフリーシナリオにおけるロボットのパフォーマンスを向上させることが示されている。
関連論文リスト
- Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Learning and Retrieval from Prior Data for Skill-based Imitation
Learning [47.59794569496233]
従来のデータから時間的に拡張された感触者スキルを抽出する,スキルベースの模倣学習フレームワークを開発した。
新規タスクの性能を著しく向上させる重要な設計選択をいくつか挙げる。
論文 参考訳(メタデータ) (2022-10-20T17:34:59Z) - Don't Start From Scratch: Leveraging Prior Data to Automate Robotic
Reinforcement Learning [70.70104870417784]
強化学習(RL)アルゴリズムは、ロボットシステムの自律的なスキル獲得を可能にするという約束を持っている。
現実のロボットRLは、通常、環境をリセットするためにデータ収集と頻繁な人間の介入を必要とする。
本研究では,従来のタスクから収集した多様なオフラインデータセットを効果的に活用することで,これらの課題にどのように対処できるかを検討する。
論文 参考訳(メタデータ) (2022-07-11T08:31:22Z) - A Simple Approach to Continual Learning by Transferring Skill Parameters [25.705923249267055]
我々は、忘れずにロボット操作スキルを継続的に取得する方法を示し、それらをスクラッチからトレーニングするために必要なサンプルをはるかに少ないものにする。
適切なカリキュラムが与えられたら、忘れずにロボット操作スキルを継続的に習得し、スクラッチからトレーニングするために必要なサンプルをはるかに少ないものにする方法を示す。
論文 参考訳(メタデータ) (2021-10-19T20:44:20Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Actionable Models: Unsupervised Offline Reinforcement Learning of
Robotic Skills [93.12417203541948]
与えられたデータセットの任意の目標状態に到達するために学習することによって、環境の機能的な理解を学ぶ目的を提案する。
提案手法は,高次元カメラ画像上で動作し,これまで見つからなかったシーンやオブジェクトに一般化した実ロボットの様々なスキルを学習することができる。
論文 参考訳(メタデータ) (2021-04-15T20:10:11Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。