論文の概要: Continual Learning using a Bayesian Nonparametric Dictionary of Weight
Factors
- arxiv url: http://arxiv.org/abs/2004.10098v3
- Date: Tue, 27 Apr 2021 23:28:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 06:13:28.263313
- Title: Continual Learning using a Bayesian Nonparametric Dictionary of Weight
Factors
- Title(参考訳): ベイズ非パラメトリックな重み係数辞書を用いた連続学習
- Authors: Nikhil Mehta, Kevin J Liang, Vinay K Verma and Lawrence Carin
- Abstract要約: 訓練されたニューラルネットワークは、シーケンシャルなタスク設定で破滅的な忘れを経験する傾向がある。
Indian Buffet Process (IBP) に基づく原則的非パラメトリック手法を提案する。
連続学習ベンチマークにおける本手法の有効性を実証し、トレーニングを通して重み要因の配分と再利用方法を分析する。
- 参考スコア(独自算出の注目度): 75.58555462743585
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Naively trained neural networks tend to experience catastrophic forgetting in
sequential task settings, where data from previous tasks are unavailable. A
number of methods, using various model expansion strategies, have been proposed
recently as possible solutions. However, determining how much to expand the
model is left to the practitioner, and often a constant schedule is chosen for
simplicity, regardless of how complex the incoming task is. Instead, we propose
a principled Bayesian nonparametric approach based on the Indian Buffet Process
(IBP) prior, letting the data determine how much to expand the model
complexity. We pair this with a factorization of the neural network's weight
matrices. Such an approach allows the number of factors of each weight matrix
to scale with the complexity of the task, while the IBP prior encourages sparse
weight factor selection and factor reuse, promoting positive knowledge transfer
between tasks. We demonstrate the effectiveness of our method on a number of
continual learning benchmarks and analyze how weight factors are allocated and
reused throughout the training.
- Abstract(参考訳): 訓練されたニューラルネットワークは、以前のタスクからのデータが利用できないシーケンシャルなタスク設定で破滅的な忘れを経験する傾向がある。
近年,様々なモデル展開戦略を用いた様々な手法が提案されている。
しかしながら、モデルをどの程度拡張するかは実践者に委ねられ、多くの場合、入ってくるタスクの複雑さに関わらず、単純さのために一定のスケジュールが選択されます。
その代わり,インド・バフェット・プロセス(IBP)に基づくベイズ的非パラメトリック手法を提案する。
これをニューラルネットワークの重み行列の因子分解と組み合わせる。
このようなアプローチにより、各重み行列の因子の数はタスクの複雑さとともにスケールできるが、IPPは疎みのある重み係数の選択と因子の再利用を奨励し、タスク間の肯定的な知識伝達を促進する。
連続学習ベンチマークにおける本手法の有効性を実証し、トレーニングを通して重み要因の配分と再利用方法を分析する。
関連論文リスト
- Switchable Decision: Dynamic Neural Generation Networks [98.61113699324429]
本稿では,各データインスタンスのリソースを動的に割り当てることで,推論を高速化するスイッチブルな決定を提案する。
提案手法は, 同一の精度を維持しながら, 推論時のコスト低減に有効である。
論文 参考訳(メタデータ) (2024-05-07T17:44:54Z) - Prior-Free Continual Learning with Unlabeled Data in the Wild [24.14279172551939]
本稿では,新しいタスクの学習モデルを段階的に更新するPFCL法を提案する。
PFCLはタスクのアイデンティティや以前のデータを知ることなく、新しいタスクを学習する。
実験の結果,PFCL法は3つの学習シナリオすべてにおいて,忘れを著しく軽減することがわかった。
論文 参考訳(メタデータ) (2023-10-16T13:59:56Z) - How Many Pretraining Tasks Are Needed for In-Context Learning of Linear Regression? [92.90857135952231]
様々なタスクで事前訓練されたトランスフォーマーは、顕著なインコンテキスト学習(ICL)能力を示す。
線形回帰のための線形パラメータ化単一層線形アテンションモデルの事前学習を行う。
論文 参考訳(メタデータ) (2023-10-12T15:01:43Z) - Complementary Learning Subnetworks for Parameter-Efficient
Class-Incremental Learning [40.13416912075668]
本稿では,2つの補完学習サブネットワークス間のシナジーを通じて連続的に学習するリハーサルフリーなCILアプローチを提案する。
提案手法は, 精度向上, メモリコスト, トレーニング効率, タスク順序など, 最先端手法と競合する結果が得られる。
論文 参考訳(メタデータ) (2023-06-21T01:43:25Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Multi-task Supervised Learning via Cross-learning [102.64082402388192]
我々は,様々なタスクを解くことを目的とした回帰関数の集合を適合させることで,マルチタスク学習と呼ばれる問題を考える。
我々の新しい定式化では、これらの関数のパラメータを2つに分けて、互いに近づきながらタスク固有のドメインで学習する。
これにより、異なるドメインにまたがって収集されたデータが、互いのタスクにおける学習パフォーマンスを改善するのに役立つ、クロス・ファーティライズが促進される。
論文 参考訳(メタデータ) (2020-10-24T21:35:57Z) - Rank-Based Multi-task Learning for Fair Regression [9.95899391250129]
バイアス付きデータセットに基づくマルチタスク回帰モデルのための新しい学習手法を開発した。
一般的な非パラメトリックオラクルベースの非ワールド乗算器データセットを使用します。
論文 参考訳(メタデータ) (2020-09-23T22:32:57Z) - A Markov Decision Process Approach to Active Meta Learning [24.50189361694407]
教師付き学習では、データが特定のタスクに関連付けられていると仮定して、与えられたデータセットに1つの統計モデルを適用する。
メタラーニングでは、データは多数のタスクと関連付けられており、同時に全てのタスクでうまく機能するモデルを模索する。
論文 参考訳(メタデータ) (2020-09-10T15:45:34Z) - Multi-Loss Weighting with Coefficient of Variations [19.37721431024278]
本稿では,変動係数に基づく重み付け手法を提案し,モデルのトレーニング中に観測された特性に基づいて重みを設定する。
提案手法は損失のバランスをとるための不確実性の尺度を組み込んでおり、その結果、他の(学習ベース)最適化を必要とせずに、トレーニング中に損失重みが進化する。
提案手法の有効性は,複数のデータセット上での深度推定とセマンティックセグメンテーションに実証的に示される。
論文 参考訳(メタデータ) (2020-09-03T14:51:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。