論文の概要: The Role of Robust Generalization in Continual Learning: Better Transfer
and Less Forgetting
- arxiv url: http://arxiv.org/abs/2211.11174v4
- Date: Sat, 16 Dec 2023 08:34:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 21:16:51.220114
- Title: The Role of Robust Generalization in Continual Learning: Better Transfer
and Less Forgetting
- Title(参考訳): 連続学習におけるロバスト一般化の役割--転校の促進と忘れの軽減
- Authors: Zenglin Shi, Ying Sun, Joo Hwee Lim, Mengmi Zhang
- Abstract要約: 本稿では,連続学習(CL)におけるロバストな一般化の役割について検討する。
近年の研究では、ロバストな一般化を示すために訓練されたモデルは、より平坦な局所性ミニマを見出す傾向にある。
本稿では,各タスクの形状とテクスチャ表現の両方を学習するオンライン形状・テクスチャ自己蒸留(STSD)手法を提案する。
- 参考スコア(独自算出の注目度): 20.11335643702469
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper considers learning a sequence of tasks continually with the
objectives of generalizing over unseen data regardless of its distribution,
accumulating knowledge and transferring knowledge across tasks. To the best of
our knowledge, no existing technique can accomplish all of these objectives
simultaneously. This paper proposes such a technique by investigating the role
of robust generalization in Continual Learning (CL). Recent findings show that
models trained to exhibit robust generalization not only generalize better, but
also demonstrate improved transferability and tend to find flatter local
minima. This motivates us to achieve robust generalization in each task in CL,
facilitating learning a new task and reducing the risk of forgetting previously
learned tasks. To achieve this, we propose a new online shape-texture
self-distillation (STSD) method that learns both shape and texture
representations for each task, improving robust generalization. Extensive
experiments demonstrate that our approach can be easily combined with existing
CL methods to improve generalization, encourage knowledge transfer, and reduce
forgetting. We also show that our approach finds flatter local minima, further
highlighting the importance of improving robust generalization in CL. Our
proposed technique is a significant step forward in achieving the
aforementioned CL objectives simultaneously.
- Abstract(参考訳): 本稿では,その分布によらず,目に見えないデータを一般化し,知識を蓄積し,タスク間で知識を伝達するという目的から,タスクの連続を継続的に学習することを検討する。
私たちの知る限りでは、これらのすべての目的を同時に達成できる既存のテクニックはありません。
本稿では,連続学習(CL)におけるロバストな一般化の役割を解明する手法を提案する。
近年の研究では、頑健な一般化を示すために訓練されたモデルは、より一般化されるだけでなく、伝達性も向上し、より平坦な局所ミニマを見つける傾向にあることが示された。
これにより、CLにおける各タスクの堅牢な一般化を実現し、新しいタスクの学習を容易にし、以前に学習したタスクを忘れるリスクを減らすことができる。
そこで本研究では,各タスクの形状とテクスチャ表現の両方を学習し,堅牢な一般化を向上する,新しいオンライン形状・テクスチャ自己蒸留法を提案する。
大規模な実験により,本手法を既存のCL手法と簡単に組み合わせることで,一般化の促進,知識伝達の促進,忘れの軽減が図られた。
また,我々のアプローチはより平坦な局所的ミニマを見出し,clにおけるロバスト一般化の改善の重要性をさらに強調する。
提案手法は,上記のCL目標を同時に達成するための重要な一歩である。
関連論文リスト
- Self-Tuning: Instructing LLMs to Effectively Acquire New Knowledge through Self-Teaching [67.11497198002165]
大きな言語モデル(LLM)は、一度のトレーニングのために最新の情報を提供するのに苦労することが多い。
効率的なヒューマンラーニングにおけるFeynman Techniqueの顕著な成功に感銘を受け、セルフチューニングを紹介した。
論文 参考訳(メタデータ) (2024-06-10T14:42:20Z) - Online Continual Learning via the Knowledge Invariant and Spread-out
Properties [4.109784267309124]
継続的な学習の鍵となる課題は破滅的な忘れ方だ。
知識不変性とスプレッドアウト特性(OCLKISP)を用いたオンライン連続学習法を提案する。
提案手法を,CIFAR 100, Split SVHN, Split CUB200, Split Tiny-Image-Netの4つのベンチマークで実証的に評価した。
論文 参考訳(メタデータ) (2023-02-02T04:03:38Z) - A Comprehensive Survey of Continual Learning: Theory, Method and
Application [64.23253420555989]
本稿では,基礎的設定,理論的基礎,代表的方法,実践的応用を橋渡しする継続的学習に関する包括的調査を行う。
連続学習の一般的な目的は、資源効率の文脈において、適切な安定性と塑性のトレードオフと適切なタスク内/タスク内一般化性を保証することであると要約する。
論文 参考訳(メタデータ) (2023-01-31T11:34:56Z) - Hierarchically Structured Task-Agnostic Continual Learning [0.0]
本研究では,連続学習のタスク非依存的な視点を取り入れ,階層的情報理論の最適性原理を考案する。
我々は,情報処理経路の集合を作成することで,忘れを緩和する,Mixture-of-Variational-Experts層と呼ばれるニューラルネットワーク層を提案する。
既存の連続学習アルゴリズムのようにタスク固有の知識を必要としない。
論文 参考訳(メタデータ) (2022-11-14T19:53:15Z) - Learning and Retrieval from Prior Data for Skill-based Imitation
Learning [47.59794569496233]
従来のデータから時間的に拡張された感触者スキルを抽出する,スキルベースの模倣学習フレームワークを開発した。
新規タスクの性能を著しく向上させる重要な設計選択をいくつか挙げる。
論文 参考訳(メタデータ) (2022-10-20T17:34:59Z) - Selecting Related Knowledge via Efficient Channel Attention for Online
Continual Learning [4.109784267309124]
Selecting Related Knowledge for Online Continual Learning (SRKOCL) という新しいフレームワークを提案する。
我々のモデルはまた、破滅的な忘れを回避すべく、経験的なリプレイと知識の蒸留を組み合わせる。
論文 参考訳(メタデータ) (2022-09-09T09:59:54Z) - Relational Experience Replay: Continual Learning by Adaptively Tuning
Task-wise Relationship [54.73817402934303]
本稿では,2段階の学習フレームワークである経験連続再生(ERR)を提案する。
ERRは、すべてのベースラインの性能を一貫して改善し、現在の最先端の手法を超えることができる。
論文 参考訳(メタデータ) (2021-12-31T12:05:22Z) - Parrot: Data-Driven Behavioral Priors for Reinforcement Learning [79.32403825036792]
そこで本研究では,実験で得られた複雑なインプット・アウトプット関係を事前に学習する手法を提案する。
RLエージェントが新規な動作を試す能力を阻害することなく、この学習が新しいタスクを迅速に学習するのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2020-11-19T18:47:40Z) - Bilevel Continual Learning [76.50127663309604]
BCL(Bilevel Continual Learning)という,継続的学習の新たな枠組みを提案する。
連続学習ベンチマーク実験では,多くの最先端手法と比較して,提案したBCLの有効性が示された。
論文 参考訳(メタデータ) (2020-07-30T16:00:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。