Fugu-MT 論文翻訳(概要): The Role of Robust Generalization in Continual Learning: Better Transfer and Less Forgetting

論文の概要: The Role of Robust Generalization in Continual Learning: Better Transfer and Less Forgetting

arxiv url: http://arxiv.org/abs/2211.11174v4
Date: Sat, 16 Dec 2023 08:34:22 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-19 21:16:51.220114
Title: The Role of Robust Generalization in Continual Learning: Better Transfer and Less Forgetting
Title（参考訳）: 連続学習におけるロバスト一般化の役割--転校の促進と忘れの軽減
Authors: Zenglin Shi, Ying Sun, Joo Hwee Lim, Mengmi Zhang
Abstract要約: 本稿では,連続学習(CL)におけるロバストな一般化の役割について検討する。近年の研究では、ロバストな一般化を示すために訓練されたモデルは、より平坦な局所性ミニマを見出す傾向にある。本稿では,各タスクの形状とテクスチャ表現の両方を学習するオンライン形状・テクスチャ自己蒸留(STSD)手法を提案する。
参考スコア（独自算出の注目度）: 20.11335643702469
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: This paper considers learning a sequence of tasks continually with the objectives of generalizing over unseen data regardless of its distribution, accumulating knowledge and transferring knowledge across tasks. To the best of our knowledge, no existing technique can accomplish all of these objectives simultaneously. This paper proposes such a technique by investigating the role of robust generalization in Continual Learning (CL). Recent findings show that models trained to exhibit robust generalization not only generalize better, but also demonstrate improved transferability and tend to find flatter local minima. This motivates us to achieve robust generalization in each task in CL, facilitating learning a new task and reducing the risk of forgetting previously learned tasks. To achieve this, we propose a new online shape-texture self-distillation (STSD) method that learns both shape and texture representations for each task, improving robust generalization. Extensive experiments demonstrate that our approach can be easily combined with existing CL methods to improve generalization, encourage knowledge transfer, and reduce forgetting. We also show that our approach finds flatter local minima, further highlighting the importance of improving robust generalization in CL. Our proposed technique is a significant step forward in achieving the aforementioned CL objectives simultaneously.
Abstract（参考訳）: 本稿では,その分布によらず,目に見えないデータを一般化し,知識を蓄積し,タスク間で知識を伝達するという目的から,タスクの連続を継続的に学習することを検討する。私たちの知る限りでは、これらのすべての目的を同時に達成できる既存のテクニックはありません。本稿では,連続学習(CL)におけるロバストな一般化の役割を解明する手法を提案する。近年の研究では、頑健な一般化を示すために訓練されたモデルは、より一般化されるだけでなく、伝達性も向上し、より平坦な局所ミニマを見つける傾向にあることが示された。これにより、CLにおける各タスクの堅牢な一般化を実現し、新しいタスクの学習を容易にし、以前に学習したタスクを忘れるリスクを減らすことができる。そこで本研究では,各タスクの形状とテクスチャ表現の両方を学習し,堅牢な一般化を向上する,新しいオンライン形状・テクスチャ自己蒸留法を提案する。大規模な実験により,本手法を既存のCL手法と簡単に組み合わせることで,一般化の促進,知識伝達の促進,忘れの軽減が図られた。また,我々のアプローチはより平坦な局所的ミニマを見出し,clにおけるロバスト一般化の改善の重要性をさらに強調する。提案手法は,上記のCL目標を同時に達成するための重要な一歩である。

関連論文リスト

Self-Tuning: Instructing LLMs to Effectively Acquire New Knowledge through Self-Teaching [67.11497198002165]
大きな言語モデル(LLM)は、一度のトレーニングのために最新の情報を提供するのに苦労することが多い。効率的なヒューマンラーニングにおけるFeynman Techniqueの顕著な成功に感銘を受け、セルフチューニングを紹介した。
論文参考訳（メタデータ） (2024-06-10T14:42:20Z)
Online Continual Learning via the Knowledge Invariant and Spread-out Properties [4.109784267309124]
継続的な学習の鍵となる課題は破滅的な忘れ方だ。知識不変性とスプレッドアウト特性(OCLKISP)を用いたオンライン連続学習法を提案する。提案手法を,CIFAR 100, Split SVHN, Split CUB200, Split Tiny-Image-Netの4つのベンチマークで実証的に評価した。
論文参考訳（メタデータ） (2023-02-02T04:03:38Z)
A Comprehensive Survey of Continual Learning: Theory, Method and Application [64.23253420555989]
本稿では,基礎的設定,理論的基礎,代表的方法,実践的応用を橋渡しする継続的学習に関する包括的調査を行う。連続学習の一般的な目的は、資源効率の文脈において、適切な安定性と塑性のトレードオフと適切なタスク内/タスク内一般化性を保証することであると要約する。
論文参考訳（メタデータ） (2023-01-31T11:34:56Z)
Hierarchically Structured Task-Agnostic Continual Learning [0.0]
本研究では,連続学習のタスク非依存的な視点を取り入れ,階層的情報理論の最適性原理を考案する。我々は,情報処理経路の集合を作成することで,忘れを緩和する,Mixture-of-Variational-Experts層と呼ばれるニューラルネットワーク層を提案する。既存の連続学習アルゴリズムのようにタスク固有の知識を必要としない。
論文参考訳（メタデータ） (2022-11-14T19:53:15Z)
Learning and Retrieval from Prior Data for Skill-based Imitation Learning [47.59794569496233]
従来のデータから時間的に拡張された感触者スキルを抽出する,スキルベースの模倣学習フレームワークを開発した。新規タスクの性能を著しく向上させる重要な設計選択をいくつか挙げる。
論文参考訳（メタデータ） (2022-10-20T17:34:59Z)
Selecting Related Knowledge via Efficient Channel Attention for Online Continual Learning [4.109784267309124]
Selecting Related Knowledge for Online Continual Learning (SRKOCL) という新しいフレームワークを提案する。我々のモデルはまた、破滅的な忘れを回避すべく、経験的なリプレイと知識の蒸留を組み合わせる。
論文参考訳（メタデータ） (2022-09-09T09:59:54Z)
Leveraging convergence behavior to balance conflicting tasks in multi-task learning [3.6212652499950138]
マルチタスク学習は、パフォーマンスの一般化を改善するために相関タスクを使用する。タスクは互いに衝突することが多いため、複数のタスクの勾配をどのように組み合わせるべきかを定義するのは難しい。バックプロパゲーション中の各タスクの重要度を調整する動的バイアスを生成するために,勾配の時間的挙動を考慮した手法を提案する。
論文参考訳（メタデータ） (2022-04-14T01:52:34Z)
Relational Experience Replay: Continual Learning by Adaptively Tuning Task-wise Relationship [54.73817402934303]
本稿では,2段階の学習フレームワークである経験連続再生(ERR)を提案する。 ERRは、すべてのベースラインの性能を一貫して改善し、現在の最先端の手法を超えることができる。
論文参考訳（メタデータ） (2021-12-31T12:05:22Z)
Parrot: Data-Driven Behavioral Priors for Reinforcement Learning [79.32403825036792]
そこで本研究では,実験で得られた複雑なインプット・アウトプット関係を事前に学習する手法を提案する。 RLエージェントが新規な動作を試す能力を阻害することなく、この学習が新しいタスクを迅速に学習するのにどのように役立つかを示す。
論文参考訳（メタデータ） (2020-11-19T18:47:40Z)
Importance Weighted Policy Learning and Adaptation [89.46467771037054]
政治外学習の最近の進歩の上に構築された,概念的にシンプルで,汎用的で,モジュール的な補完的アプローチについて検討する。このフレームワークは確率論的推論文学のアイデアにインスパイアされ、堅牢な非政治学習と事前の行動を組み合わせる。提案手法は,メタ強化学習ベースラインと比較して,ホールドアウトタスクにおける競合適応性能を実現し,複雑なスパース・リワードシナリオにスケールすることができる。
論文参考訳（メタデータ） (2020-09-10T14:16:58Z)
Bilevel Continual Learning [76.50127663309604]
BCL(Bilevel Continual Learning)という,継続的学習の新たな枠組みを提案する。連続学習ベンチマーク実験では,多くの最先端手法と比較して,提案したBCLの有効性が示された。
論文参考訳（メタデータ） (2020-07-30T16:00:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。