論文の概要: Lifelong Learning using Eigentasks: Task Separation, Skill Acquisition,
and Selective Transfer
- arxiv url: http://arxiv.org/abs/2007.06918v1
- Date: Tue, 14 Jul 2020 09:06:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 13:23:38.669975
- Title: Lifelong Learning using Eigentasks: Task Separation, Skill Acquisition,
and Selective Transfer
- Title(参考訳): 固有タスクを用いた生涯学習:タスク分離、スキル獲得、選択転送
- Authors: Aswin Raghavan, Jesse Hostetler, Indranil Sur, Abrar Rahman, Ajay
Divakaran
- Abstract要約: 生涯学習のための固有タスクフレームワークを紹介する。
固有タスク(英: eigentask)とは、一連の関連するタスクを、スキルの入力空間からサンプリングできる生成モデルと組み合わせて解決するスキルである。
本稿では,我々のフレームワークにおける学習のためのタスク学習と知識の統合を交互に行う覚醒サイクルを提案し,それを生涯指導的学習と生涯RLのためにインスタンス化する。
- 参考スコア(独自算出の注目度): 5.956779409640442
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce the eigentask framework for lifelong learning. An eigentask is a
pairing of a skill that solves a set of related tasks, paired with a generative
model that can sample from the skill's input space. The framework extends
generative replay approaches, which have mainly been used to avoid catastrophic
forgetting, to also address other lifelong learning goals such as forward
knowledge transfer. We propose a wake-sleep cycle of alternating task learning
and knowledge consolidation for learning in our framework, and instantiate it
for lifelong supervised learning and lifelong RL. We achieve improved
performance over the state-of-the-art in supervised continual learning, and
show evidence of forward knowledge transfer in a lifelong RL application in the
game Starcraft2.
- Abstract(参考訳): 生涯学習のための固有タスクフレームワークを紹介する。
固有タスク(eigentask)とは、関連するタスクの集合を解決するスキルのペアであり、そのスキルの入力空間からサンプルできる生成モデルとペアリングする。
このフレームワークは、主に破滅的な忘れを避けるために使われてきた生成的リプレイアプローチを拡張し、フォワード・ナレッジ・トランスファーのような他の生涯学習目標にも対処する。
我々は,学習のためのタスク学習と知識統合を交互に行うウェイクスリープサイクルを提案し,生涯教師付き学習と生涯rlをインスタンス化する。
我々は,教師付き連続学習における最先端の性能向上を実現し,ゲーム『スタークラフト2』の生涯RLアプリケーションにおけるフォワード知識伝達の証拠を示す。
関連論文リスト
- Recall-Oriented Continual Learning with Generative Adversarial
Meta-Model [5.710971447109951]
本稿では,安定性・塑性ジレンマに対処するリコール指向連続学習フレームワークを提案する。
人間の脳が安定性と可塑性のメカニズムを分離する能力に触発されて、私たちのフレームワークは2段階のアーキテクチャで構成されています。
我々は,新たな知識を効果的に学習するだけでなく,従来の知識の安定性も高いことを示す。
論文 参考訳(メタデータ) (2024-03-05T16:08:59Z) - LIBERO: Benchmarking Knowledge Transfer for Lifelong Robot Learning [64.55001982176226]
LIBEROは、ロボット操作のための生涯学習の新しいベンチマークである。
宣言的知識、手続き的知識、あるいは両者の混在を効率的に伝達する方法に焦点を当てる。
我々は、無限に多くのタスクを生成できる拡張可能な手続き生成パイプラインを開発した。
論文 参考訳(メタデータ) (2023-06-05T23:32:26Z) - Learning and Retrieval from Prior Data for Skill-based Imitation
Learning [47.59794569496233]
従来のデータから時間的に拡張された感触者スキルを抽出する,スキルベースの模倣学習フレームワークを開発した。
新規タスクの性能を著しく向上させる重要な設計選択をいくつか挙げる。
論文 参考訳(メタデータ) (2022-10-20T17:34:59Z) - Continual Prompt Tuning for Dialog State Tracking [58.66412648276873]
望ましいダイアログシステムは、古いスキルを忘れずに継続的に新しいスキルを学ぶことができるべきである。
本稿では,タスク間の知識伝達を可能にするパラメータ効率フレームワークであるContinuous Prompt Tuningを提案する。
論文 参考訳(メタデータ) (2022-03-13T13:22:41Z) - Lifelong Reinforcement Learning with Temporal Logic Formulas and Reward
Machines [30.161550541362487]
逐次線形時間論理式とReward Machines(LSRM)を用いた長寿命強化学習を提案する。
まず、線形時間論理(SLTL)を導入し、既存の線形時間論理言語を補足する。
次に、Reward Machines (RM) を用いて、高レベルイベントを符号化したタスクの構造的報酬関数を利用する。
論文 参考訳(メタデータ) (2021-11-18T02:02:08Z) - MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale [103.7609761511652]
大規模集団ロボット学習システムが,行動のレパートリーを同時に獲得できることを示す。
新しいタスクは、以前学んだタスクから継続的にインスタンス化できる。
我々は,7台のロボットから収集したデータを用いて,実世界のタスク12組でシステムを訓練し,評価する。
論文 参考訳(メタデータ) (2021-04-16T16:38:02Z) - Reset-Free Lifelong Learning with Skill-Space Planning [105.00539596788127]
非分離寿命RLのためのアルゴリズムフレームワークであるLifelong Skill Planning (LiSP)を提案する。
LiSPは、本質的な報酬を用いて教師なしの方法でスキルを学び、学習力学モデルを用いて学習スキルを計画する。
我々は,lispが長期計画に成功し,非定常環境や非定型環境においても壊滅的な失敗を回避できるエージェントを学習できることを実証的に示す。
論文 参考訳(メタデータ) (2020-12-07T09:33:02Z) - Meta-Learning with Sparse Experience Replay for Lifelong Language
Learning [26.296412053816233]
本稿では,スパース体験を再現したメタラーニングに基づく言語タスクの生涯学習のための新しいアプローチを提案する。
本研究では,タスクのストリーム上で1回のパスを実行するという現実的な設定の下で,生涯のテキスト分類と関係抽出に関する最先端結果を得る。
論文 参考訳(メタデータ) (2020-09-10T14:36:38Z) - Bilevel Continual Learning [76.50127663309604]
BCL(Bilevel Continual Learning)という,継続的学習の新たな枠組みを提案する。
連続学習ベンチマーク実験では,多くの最先端手法と比較して,提案したBCLの有効性が示された。
論文 参考訳(メタデータ) (2020-07-30T16:00:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。