論文の概要: Provable Hierarchical Lifelong Learning with a Sketch-based Modular
Architecture
- arxiv url: http://arxiv.org/abs/2112.10919v1
- Date: Tue, 21 Dec 2021 00:45:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 00:09:22.523034
- Title: Provable Hierarchical Lifelong Learning with a Sketch-based Modular
Architecture
- Title(参考訳): スケッチ型モジュラーアーキテクチャによる階層型生涯学習の実現
- Authors: Zihao Deng, Zee Fryer, Brendan Juba, Rina Panigrahy, Xin Wang
- Abstract要約: 我々のアーキテクチャは理論的には、以前に学習されたタスクをサブルーチンとして、関数にアクセスできる関数によって解決できるタスクを学習できることを示します。
このような方法で学習できるタスクは、実際に標準的なトレーニング手法では学ばないことを実証的に示します。
- 参考スコア(独自算出の注目度): 28.763868513396705
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a modular architecture for the lifelong learning of hierarchically
structured tasks. Specifically, we prove that our architecture is theoretically
able to learn tasks that can be solved by functions that are learnable given
access to functions for other, previously learned tasks as subroutines. We
empirically show that some tasks that we can learn in this way are not learned
by standard training methods in practice; indeed, prior work suggests that some
such tasks cannot be learned by any efficient method without the aid of the
simpler tasks. We also consider methods for identifying the tasks
automatically, without relying on explicitly given indicators.
- Abstract(参考訳): 階層的なタスクの生涯学習のためのモジュールアーキテクチャを提案する。
具体的には,従来学習されていたタスクをサブルーチンとして利用するために,学習可能な関数によって解決可能なタスクを理論的に学習できることを実証する。
このような方法で学習できるタスクは、実際に標準的な訓練方法によって学習されていないことを実証的に示す。
また,タスクを自動的に識別する手法についても検討した。
関連論文リスト
- Transferring Knowledge for Reinforcement Learning in Contact-Rich
Manipulation [10.219833196479142]
複数のスキルの前提を活かして、類似したタスクのファミリー内で知識を伝達するという課題に対処する。
提案手法は, 先行タスク毎の実証軌道から, スキル埋め込みを表す潜在行動空間を学習する。
我々は,ペグ・イン・ホール・イン・イン・イン・イン・イン・イン・イン・イン・イン・インサート・タスクのセットを用いて本手法の評価を行い,トレーニング中に遭遇したことのない新しいタスクへのより良い一般化を実証した。
論文 参考訳(メタデータ) (2022-09-19T10:31:13Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Modular Adaptive Policy Selection for Multi-Task Imitation Learning
through Task Division [60.232542918414985]
マルチタスク学習は、しばしば負の伝達に悩まされ、タスク固有の情報を共有する。
これは、プロトポリケーションをモジュールとして使用して、タスクを共有可能な単純なサブ振る舞いに分割する。
また、タスクを共有サブ行動とタスク固有のサブ行動の両方に自律的に分割する能力を示す。
論文 参考訳(メタデータ) (2022-03-28T15:53:17Z) - Possibility Before Utility: Learning And Using Hierarchical Affordances [21.556661319375255]
強化学習アルゴリズムは複雑な階層的依存構造を持つタスクに苦労する。
本稿では、より効果的な学習のために不可能なサブタスクを実践するために、階層的アフォーマンス学習(HAL)という階層的アフォーマンス学習(HAL)を提案する。
論文 参考訳(メタデータ) (2022-03-23T19:17:22Z) - Learning from Guided Play: A Scheduled Hierarchical Approach for
Improving Exploration in Adversarial Imitation Learning [7.51557557629519]
本稿では,主課題,複数の補助課題に加えて,専門家による実演を活用するためのフレームワークであるLearning from Guided Play (LfGP)を紹介する。
主なタスクに対する学習効率は、ボトルネック遷移に挑戦して改善され、専門家データがタスク間で再利用可能になり、学習した補助タスクモデルの再利用を通じて学習を移行することが可能になります。
論文 参考訳(メタデータ) (2021-12-16T14:58:08Z) - Learning Task Decomposition with Ordered Memory Policy Network [73.3813423684999]
OMPN(Ordered Memory Policy Network)を提案し、デモから学習することでサブタスク階層を発見する。
ompnは部分的に観測可能な環境に適用でき、高いタスク分解性能を達成できる。
私たちの視覚化は、サブタスク階層がモデルに出現できることを確認します。
論文 参考訳(メタデータ) (2021-03-19T18:13:35Z) - Towards Improved Model Design for Authorship Identification: A Survey on
Writing Style Understanding [30.642840676899734]
著者識別タスクは言語スタイルに大きく依存している。
手作りの機能セットに基づく従来の機械学習手法は、すでにパフォーマンスの限界に近づいている。
スタイル関連タスクにおける卓越した手法を概説し、それらの組み合わせがトップパフォーマンスモデルでどのように使われているかを分析する。
論文 参考訳(メタデータ) (2020-09-30T05:17:42Z) - Meta-Reinforcement Learning Robust to Distributional Shift via Model
Identification and Experience Relabeling [126.69933134648541]
本稿では,テスト時にアウト・オブ・ディストリビューション・タスクに直面した場合に,効率よく外挿できるメタ強化学習アルゴリズムを提案する。
我々の手法は単純な洞察に基づいており、動的モデルが非政治データに効率的かつ一貫して適応可能であることを認識している。
論文 参考訳(メタデータ) (2020-06-12T13:34:46Z) - Adversarial Continual Learning [99.56738010842301]
本稿では,タスク不変およびタスク特化機能に対する不整合表現を学習するハイブリッド連続学習フレームワークを提案する。
本モデルでは,タスク固有のスキルの忘れを防止するためにアーキテクチャの成長と,共有スキルを維持するための経験的リプレイアプローチを組み合わせる。
論文 参考訳(メタデータ) (2020-03-21T02:08:17Z) - Automated Relational Meta-learning [95.02216511235191]
本稿では,クロスタスク関係を自動的に抽出し,メタ知識グラフを構築する自動リレーショナルメタ学習フレームワークを提案する。
我々は,2次元玩具の回帰と少数ショット画像分類に関する広範な実験を行い,ARMLが最先端のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-01-03T07:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。