論文の概要: Natural continual learning: success is a journey, not (just) a
destination
- arxiv url: http://arxiv.org/abs/2106.08085v1
- Date: Tue, 15 Jun 2021 12:24:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 21:25:57.921720
- Title: Natural continual learning: success is a journey, not (just) a
destination
- Title(参考訳): 自然な継続的学習:成功は目的地ではなく旅である
- Authors: Ta-Chu Kao, Kristopher T. Jensen, Alberto Bernacchia, Guillaume
Hennequin
- Abstract要約: 自然継続学習(NCL)は、重み付け正規化と射影勾配降下を統一する新しい手法である。
提案手法は,RNNにおける連続学習問題に適用した場合,標準重み付け正規化手法とプロジェクションベースアプローチの両方に優れる。
トレーニングされたネットワークは、生体回路の実験的な発見と同様に、新しいタスクが学習されると強く保存されるタスク固有ダイナミクスを進化させる。
- 参考スコア(独自算出の注目度): 9.462808515258464
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biological agents are known to learn many different tasks over the course of
their lives, and to be able to revisit previous tasks and behaviors with little
to no loss in performance. In contrast, artificial agents are prone to
'catastrophic forgetting' whereby performance on previous tasks deteriorates
rapidly as new ones are acquired. This shortcoming has recently been addressed
using methods that encourage parameters to stay close to those used for
previous tasks. This can be done by (i) using specific parameter regularizers
that map out suitable destinations in parameter space, or (ii) guiding the
optimization journey by projecting gradients into subspaces that do not
interfere with previous tasks. However, parameter regularization has been shown
to be relatively ineffective in recurrent neural networks (RNNs), a setting
relevant to the study of neural dynamics supporting biological continual
learning. Similarly, projection based methods can reach capacity and fail to
learn any further as the number of tasks increases. To address these
limitations, we propose Natural Continual Learning (NCL), a new method that
unifies weight regularization and projected gradient descent. NCL uses Bayesian
weight regularization to encourage good performance on all tasks at convergence
and combines this with gradient projections designed to prevent catastrophic
forgetting during optimization. NCL formalizes gradient projection as a trust
region algorithm based on the Fisher information metric, and achieves
scalability via a novel Kronecker-factored approximation strategy. Our method
outperforms both standard weight regularization techniques and projection based
approaches when applied to continual learning problems in RNNs. The trained
networks evolve task-specific dynamics that are strongly preserved as new tasks
are learned, similar to experimental findings in biological circuits.
- Abstract(参考訳): 生物学的エージェントは、人生を通じて多くの異なるタスクを学習し、パフォーマンスをほとんど損なうことなく、以前のタスクや動作を再検討できることが知られている。
対照的に、人工エージェントは「破滅的な忘れる」傾向にあり、新しいエージェントを取得すると、以前のタスクのパフォーマンスは急速に低下する。
この欠点は、最近、パラメーターが以前のタスクで使われるパラメータに近づき続けるよう促すメソッドを使用して対処された。
これは、(i)パラメータ空間の適切な宛先をマッピングする特定のパラメータ正規化器、または(ii)前のタスクに干渉しない部分空間に勾配を投影することで最適化経路を導くことで実現できる。
しかし、パラメータ正則化は、生物学的連続学習をサポートする神経力学の研究に関連する設定であるリカレントニューラルネットワーク(RNN)において比較的効果が低いことが示されている。
同様に、プロジェクションベースのメソッドはキャパシティに到達し、タスク数が増えるにつれてそれ以上学習できない。
これらの制約に対処するために、重み正規化と射影勾配降下を統一する新しい手法であるNature Continual Learning (NCL)を提案する。
NCLはベイズ量正則化を用いて収束時の全てのタスクの性能を向上させるとともに、最適化時の破滅的な忘れ込みを防ぐために設計された勾配射影と組み合わせている。
NCLは、フィッシャー情報量に基づく信頼領域アルゴリズムとして勾配予測を定式化し、新しいKronecker-factored approximation戦略によりスケーラビリティを実現する。
提案手法は,RNNにおける連続学習問題に適用した場合,標準重み正規化手法とプロジェクションベースアプローチの両方に優れる。
トレーニングされたネットワークは、生体回路の実験的な発見と同様に、新しいタスクが学習されると強く保存されるタスク固有ダイナミクスを進化させる。
関連論文リスト
- CODE-CL: COnceptor-Based Gradient Projection for DEep Continual Learning [7.573297026523597]
我々は,Deep Continual Learning (CODE-CL) のためのConceptor-based gradient projectionを導入する。
CODE-CLは、過去のタスクの入力空間における方向的重要性を符号化し、新しい知識統合を1-S$で変調する。
概念に基づく表現を用いてタスク重複を分析し,高い相関性を持つタスクを同定する。
論文 参考訳(メタデータ) (2024-11-21T22:31:06Z) - Gradient-Free Training of Recurrent Neural Networks using Random Perturbations [1.1742364055094265]
リカレントニューラルネットワーク(RNN)は、チューリング完全性とシーケンシャルな処理能力のために、計算の潜在能力を秘めている。
時間によるバックプロパゲーション(BPTT)は、時間とともにRNNをアンロールすることでバックプロパゲーションアルゴリズムを拡張する。
BPTTは、前方と後方のフェーズをインターリーブし、正確な勾配情報を格納する必要があるなど、大きな欠点に悩まされている。
BPTTと競合するRNNにおける摂動学習に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-05-14T21:15:29Z) - Continual Learning via Sequential Function-Space Variational Inference [65.96686740015902]
連続学習を逐次関数空間変動推論として定式化した目的を提案する。
ニューラルネットワークの予測を直接正規化する目的と比較して、提案した目的はより柔軟な変動分布を可能にする。
タスクシーケンスの範囲で、逐次関数空間変動推論によってトレーニングされたニューラルネットワークは、関連する手法でトレーニングされたネットワークよりも予測精度が良いことを実証した。
論文 参考訳(メタデータ) (2023-12-28T18:44:32Z) - Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.34904967046097]
継続的な学習は、モデルが以前に学習した情報を忘れてしまう破滅的な忘れ込みの課題を克服しようとする。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れを減らし,新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-15T17:10:51Z) - Continual Learning with Pretrained Backbones by Tuning in the Input
Space [44.97953547553997]
ディープラーニングモデルを非定常環境に適用することの本質的な困難さは、ニューラルネットワークの実際のタスクへの適用性を制限している。
ネットワークの事前学習部分の更新を回避し、通常の分類ヘッドだけでなく、新たに導入した学習可能なパラメータのセットも学習することで、微調整手順をより効果的にするための新しい戦略を提案する。
論文 参考訳(メタデータ) (2023-06-05T15:11:59Z) - Globally Optimal Training of Neural Networks with Threshold Activation
Functions [63.03759813952481]
しきい値アクティベートを伴うディープニューラルネットワークの重み劣化正規化学習問題について検討した。
ネットワークの特定の層でデータセットを破砕できる場合に、簡易な凸最適化の定式化を導出する。
論文 参考訳(メタデータ) (2023-03-06T18:59:13Z) - Continual Learning with Scaled Gradient Projection [8.847574864259391]
ニューラルネットワークでは、連続学習はシーケンシャルタスク間の勾配干渉を引き起こし、新しいタスクを学習しながら古いタスクを忘れてしまう。
本稿では,忘れを最小化しつつ,新しい学習を改善するためのスケールドグラディエント・プロジェクション(SGP)手法を提案する。
画像の連続的分類から強化学習タスクまでに及ぶ実験を行い、最先端の手法よりも訓練オーバーヘッドの少ない性能を報告した。
論文 参考訳(メタデータ) (2023-02-02T19:46:39Z) - Learning Bayesian Sparse Networks with Full Experience Replay for
Continual Learning [54.7584721943286]
継続学習(CL)手法は、機械学習モデルが、以前にマスターされたタスクを壊滅的に忘れることなく、新しいタスクを学習できるようにすることを目的としている。
既存のCLアプローチは、しばしば、事前に確認されたサンプルのバッファを保持し、知識蒸留を行い、あるいはこの目標に向けて正規化技術を使用する。
我々は,現在および過去のタスクを任意の段階で学習するために,スパースニューロンのみを活性化し,選択することを提案する。
論文 参考訳(メタデータ) (2022-02-21T13:25:03Z) - AdaS: Adaptive Scheduling of Stochastic Gradients [50.80697760166045]
我々は、textit "knowledge gain" と textit "mapping condition" の概念を導入し、Adaptive Scheduling (AdaS) と呼ばれる新しいアルゴリズムを提案する。
実験によると、AdaSは派生した指標を用いて、既存の適応学習手法よりも高速な収束と優れた一般化、そして(b)いつトレーニングを中止するかを決定するための検証セットへの依存の欠如を示す。
論文 参考訳(メタデータ) (2020-06-11T16:36:31Z) - Continual Deep Learning by Functional Regularisation of Memorable Past [95.97578574330934]
知的システムにとって、新しいスキルを継続的に学習することは重要だが、標準的なディープラーニング手法は、過去の破滅的な忘れ物に悩まされている。
本稿では, 過去の記憶に残るいくつかの例を, 忘れることを避けるために活用する機能正規化手法を提案する。
提案手法は,標準ベンチマーク上での最先端性能を実現し,正規化とメモリベースの手法を自然に組み合わせた生涯学習の新たな方向性を開拓する。
論文 参考訳(メタデータ) (2020-04-29T10:47:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。