論文の概要: Continual Learning for Autonomous Robots: A Prototype-based Approach
- arxiv url: http://arxiv.org/abs/2404.00418v1
- Date: Sat, 30 Mar 2024 16:54:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 03:49:50.866839
- Title: Continual Learning for Autonomous Robots: A Prototype-based Approach
- Title(参考訳): 自律型ロボットの連続学習--プロトタイプに基づくアプローチ
- Authors: Elvin Hajizada, Balachandran Swaminathan, Yulia Sandamirskaya,
- Abstract要約: Continually Learning Prototypes (CLP)は、ロボットのための自律的な生涯学習のプロトタイプである。
CLPは新規性を検出し、監督なしで新しいアイテムを学習する。
CLPは、超低消費電力、リアルタイム処理能力、オンチップ学習を特徴とするニューロモルフィックハードウェアと互換性がある。
- 参考スコア(独自算出の注目度): 5.807819480844127
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans and animals learn throughout their lives from limited amounts of sensed data, both with and without supervision. Autonomous, intelligent robots of the future are often expected to do the same. The existing continual learning (CL) methods are usually not directly applicable to robotic settings: they typically require buffering and a balanced replay of training data. A few-shot online continual learning (FS-OCL) setting has been proposed to address more realistic scenarios where robots must learn from a non-repeated sparse data stream. To enable truly autonomous life-long learning, an additional challenge of detecting novelties and learning new items without supervision needs to be addressed. We address this challenge with our new prototype-based approach called Continually Learning Prototypes (CLP). In addition to being capable of FS-OCL learning, CLP also detects novel objects and learns them without supervision. To mitigate forgetting, CLP utilizes a novel metaplasticity mechanism that adapts the learning rate individually per prototype. CLP is rehearsal-free, hence does not require a memory buffer, and is compatible with neuromorphic hardware, characterized by ultra-low power consumption, real-time processing abilities, and on-chip learning. Indeed, we have open-sourced a simple version of CLP in the neuromorphic software framework Lava, targetting Intel's neuromorphic chip Loihi 2. We evaluate CLP on a robotic vision dataset, OpenLORIS. In a low-instance FS-OCL scenario, CLP shows state-of-the-art results. In the open world, CLP detects novelties with superior precision and recall and learns features of the detected novel classes without supervision, achieving a strong baseline of 99% base class and 65%/76% (5-shot/10-shot) novel class accuracy.
- Abstract(参考訳): 人間と動物は、監督と無監督の両方で、限られた量の知覚されたデータから人生を通して学習する。
未来の自律的でインテリジェントなロボットは、しばしば同じことをする。
既存の継続学習(CL)メソッドは、通常、ロボットの設定に直接適用されない。
数ショットのオンライン連続学習(FS-OCL)設定は、ロボットが非繰り返しスパースデータストリームから学ぶ必要があるより現実的なシナリオに対処するために提案されている。
真に自律的な生涯学習を可能にするためには、新規性の検出と新しい項目の学習を、監督なしに行う必要がある。
我々はこの課題に,CLP(Continuous Learning Prototypes)と呼ばれる新しいプロトタイプベースのアプローチで対処する。
FS-OCL学習の能力に加えて、CLPは新しい物体を検出し、監督なしで学習する。
忘れを緩和するために、CLPは、プロトタイプ毎に学習率を個別に適応する新しいメタ塑性機構を利用する。
CLPはリハーサルフリーであるため、メモリバッファを必要とせず、超低消費電力、リアルタイム処理能力、オンチップ学習を特徴とするニューロモルフィックハードウェアと互換性がある。
実際、我々は、IntelのニューロモーフィックチップLoihi 2.0をターゲットにした、ニューロモーフィックソフトウェアフレームワークLavaのCLPの簡単なバージョンをオープンソースにした。
ロボットビジョンデータセットOpenLORISでCLPを評価した。
低インスタンスのFS-OCLシナリオでは、CLPは最先端の結果を示す。
オープンな世界では、CLPは優れた精度で新規性を検出してリコールし、検出された新規クラスの特徴を監督せずに学習し、99%のベースクラスと65%/76%(5ショット/10ショット)の新規クラス精度の強いベースラインを達成する。
関連論文リスト
- KALIE: Fine-Tuning Vision-Language Models for Open-World Manipulation without Robot Data [45.25288643161976]
本稿では,ロボット制御をスケーラブルに行うために,KALIE(Keypoint Affordance Learning from Imagined Environments)を提案する。
モーターコマンドを直接生成する代わりに、KALIEはポイントベースの価格表現を予測してロボットを制御する。
我々はKALIEが、50個のデータポイントしか持たない未確認オブジェクトで、新しい操作タスクを堅牢に解くことができることを実証した。
論文 参考訳(メタデータ) (2024-09-21T08:45:16Z) - Towards Non-Exemplar Semi-Supervised Class-Incremental Learning [33.560003528712414]
クラス増分学習は、古いクラスの識別性を保ちながら、新しいクラスを徐々に認識することを目的としている。
コントラスト学習と半教師付きインクリメンタルプロトタイプ分類器(Semi-IPC)を用いた非経験的半教師付きCILフレームワークを提案する。
Semi-IPCは教師なしの正規化で各クラスのプロトタイプを学習し、部分的にラベル付けされた新しいデータからモデルを漸進的に学習することを可能にする。
論文 参考訳(メタデータ) (2024-03-27T06:28:19Z) - Foundation Policies with Hilbert Representations [54.44869979017766]
ラベルなしオフラインデータから一般ポリシーを事前学習するための教師なしフレームワークを提案する。
我々の重要な洞察は、基盤となる環境の時間的構造を保存する構造的表現を学習することである。
実験の結果、教師なしのポリシーは、ゴール条件付きおよび一般のRLタスクをゼロショットで解決できることがわかった。
論文 参考訳(メタデータ) (2024-02-23T19:09:10Z) - SERL: A Software Suite for Sample-Efficient Robotic Reinforcement
Learning [85.21378553454672]
筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。
我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。
これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文 参考訳(メタデータ) (2024-01-29T10:01:10Z) - Automating Continual Learning [42.710124929514066]
汎用学習システムは、常に変化する環境において、オープンエンドで自己改善するべきである。
本稿では,自己参照型ニューラルネットワークのメタ学習のための自動連続学習(ACL)を提案する。
論文 参考訳(メタデータ) (2023-12-01T01:25:04Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - PILOT: A Pre-Trained Model-Based Continual Learning Toolbox [71.63186089279218]
本稿では,PILOTとして知られるモデルベース連続学習ツールボックスについて紹介する。
一方、PILOTはL2P、DualPrompt、CODA-Promptといった事前学習モデルに基づいて、最先端のクラスインクリメンタル学習アルゴリズムを実装している。
一方、PILOTは、事前学習されたモデルの文脈に典型的なクラス増分学習アルゴリズムを適合させ、それらの効果を評価する。
論文 参考訳(メタデータ) (2023-09-13T17:55:11Z) - Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from
Offline Data [101.43350024175157]
自己指導型学習は、制御戦略を学ぶのに必要な人間のアノテーションとエンジニアリングの労力を減らす可能性がある。
我々の研究は、強化学習(RL)自体が自己監督的な問題であることを示す先行研究に基づいている。
コントラスト学習に基づく自己教師付きRLアルゴリズムは,実世界の画像に基づくロボット操作タスクを解くことができることを示す。
論文 参考訳(メタデータ) (2023-06-06T01:36:56Z) - Deep Active Learning Using Barlow Twins [0.0]
畳み込みニューラルネットワーク(CNN)の一般化性能は、トレーニング画像の量、品質、多様性に大きく左右される。
タスクのアクティブラーニングの目標は、ラベルのないプールから最も情報に富んだサンプルを引き出すことである。
本稿では,すべてのデータセットに対する能動的学習手法であるBarlowTwins(DALBT)を用いたDeep Active Learningを提案する。
論文 参考訳(メタデータ) (2022-12-30T12:39:55Z) - The CLEAR Benchmark: Continual LEArning on Real-World Imagery [77.98377088698984]
連続学習(CL)は、生涯AIにとって重要な課題であると考えられている。
本稿では,視覚概念の自然な時間進化を伴う最初の連続画像分類ベンチマークであるCLEARを紹介する。
単純な教師なし事前学習のステップで、最先端のCLアルゴリズムがすでに強化されていることが分かりました。
論文 参考訳(メタデータ) (2022-01-17T09:09:09Z) - Semi-supervised on-device neural network adaptation for remote and
portable laser-induced breakdown spectroscopy [0.22843885788439797]
LIBS用軽量多層パーセプトロン(MLP)モデルを導入し、新しい入力データのラベルを必要とせずにオンデバイスで適応できます。
データストリーミング中の平均精度は89.3%で、適応をサポートしないモデルに比べて最大2.1%高い精度を示している。
論文 参考訳(メタデータ) (2021-04-08T00:20:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。