Fugu-MT 論文翻訳(概要): Adversarially Diversified Rehearsal Memory (ADRM): Mitigating Memory Overfitting Challenge in Continual Learning

論文の概要: Adversarially Diversified Rehearsal Memory (ADRM): Mitigating Memory Overfitting Challenge in Continual Learning

arxiv url: http://arxiv.org/abs/2405.11829v1
Date: Mon, 20 May 2024 06:56:43 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-21 13:53:58.487574
Title: Adversarially Diversified Rehearsal Memory (ADRM): Mitigating Memory Overfitting Challenge in Continual Learning
Title（参考訳）: Adversarially Diversified Rehearsal Memory (ADRM):連続学習におけるメモリ過剰化課題の緩和
Authors: Hikmat Khan, Ghulam Rasool, Nidhal Carla Bouaynaya,
Abstract要約: 継続的な学習は、それまでの知識を忘れずに、静止しないデータ分布を学習することに焦点を当てる。リハーサルベースのアプローチは、破滅的な忘れに対処するために一般的に使用される。本稿では、メモリ過度に適合する課題に対処するために、Adversarially Diversified Rehearsal Memoryを導入する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Continual learning focuses on learning non-stationary data distribution without forgetting previous knowledge. Rehearsal-based approaches are commonly used to combat catastrophic forgetting. However, these approaches suffer from a problem called "rehearsal memory overfitting, " where the model becomes too specialized on limited memory samples and loses its ability to generalize effectively. As a result, the effectiveness of the rehearsal memory progressively decays, ultimately resulting in catastrophic forgetting of the learned tasks. We introduce the Adversarially Diversified Rehearsal Memory (ADRM) to address the memory overfitting challenge. This novel method is designed to enrich memory sample diversity and bolster resistance against natural and adversarial noise disruptions. ADRM employs the FGSM attacks to introduce adversarially modified memory samples, achieving two primary objectives: enhancing memory diversity and fostering a robust response to continual feature drifts in memory samples. Our contributions are as follows: Firstly, ADRM addresses overfitting in rehearsal memory by employing FGSM to diversify and increase the complexity of the memory buffer. Secondly, we demonstrate that ADRM mitigates memory overfitting and significantly improves the robustness of CL models, which is crucial for safety-critical applications. Finally, our detailed analysis of features and visualization demonstrates that ADRM mitigates feature drifts in CL memory samples, significantly reducing catastrophic forgetting and resulting in a more resilient CL model. Additionally, our in-depth t-SNE visualizations of feature distribution and the quantification of the feature similarity further enrich our understanding of feature representation in existing CL approaches. Our code is publically available at https://github.com/hikmatkhan/ADRM.
Abstract（参考訳）: 継続的な学習は、それまでの知識を忘れずに、静止しないデータ分布を学習することに焦点を当てる。リハーサルベースのアプローチは、破滅的な忘れに対処するために一般的に使用される。しかし、これらのアプローチは「リハーサルメモリオーバーフィット」と呼ばれる問題に悩まされ、モデルが限られたメモリサンプルに過度に特化し、効果的に一般化する能力を失う。その結果、リハーサル記憶の有効性は徐々に低下し、最終的には学習したタスクを破滅的に忘れてしまう。本稿では、メモリ過適合問題に対処するため、ADRM(Adversarially Diversified Rehearsal Memory)を導入する。本手法は, 自然および逆方向のノイズ破壊に対して, メモリサンプルの多様性を増進し, 耐性を高めるために設計されている。 ADRMはFGSM攻撃を使用して、逆修正されたメモリサンプルを導入し、メモリの多様性の向上と、メモリサンプルにおける連続的な機能ドリフトに対する堅牢な応答の促進という2つの主要な目的を達成する。第一に、ADRMはFGSMを用いてメモリバッファの複雑さを多様化し増大させ、リハーサルメモリに過度に適合する。第2に、ADRMはメモリ過適合を緩和し、安全クリティカルなアプリケーションに欠かせないCLモデルの堅牢性を著しく改善することを示した。最後に,ADRMがCLメモリサンプルのドリフトを緩和し,破滅的忘れを著しく低減し,より弾力性のあるCLモデルが得られることを示す。さらに,特徴分布の詳細なt-SNE可視化と特徴類似性の定量化により,既存のCLアプローチにおける特徴表現の理解を深めることができた。私たちのコードはhttps://github.com/hikmatkhan/ADRM.comで公開されています。

関連論文リスト

How Memory Management Impacts LLM Agents: An Empirical Study of Experience-Following Behavior [49.62361184944454]
メモリは、大きな言語モデル(LLM)ベースのエージェントにおいて重要なコンポーネントである。メモリ管理の選択がLLMエージェントの行動,特に長期的パフォーマンスに与える影響について検討する。
論文参考訳（メタデータ） (2025-05-21T22:35:01Z)
Memory-enhanced Retrieval Augmentation for Long Video Understanding [91.7163732531159]
本稿では,メモリ強化型RAGベースの新しいアプローチであるMemVidを紹介する。提案手法は,1) 全体的映像情報の記憶,2) メモリに基づくタスクの情報要求の推論,3) 情報要求に基づくクリティカルモーメントの検索,4) 最終回答を生成するための検索モーメントの抽出という4つの基本的なステップで機能する。 MemVid は LVLM 法と RAG 法に比較して, 効率と有効性を示す。
論文参考訳（メタデータ） (2025-03-12T08:23:32Z)
Stable Hadamard Memory: Revitalizing Memory-Augmented Agents for Reinforcement Learning [64.93848182403116]
現在のディープラーニングメモリモデルは、部分的に観察可能で長期にわたる強化学習環境で苦労している。本稿では,強化学習エージェントのための新しい記憶モデルであるStable Hadamard Memoryを紹介する。我々の手法は、部分的に観測可能なベンチマークに挑戦する上で、最先端のメモリベースの手法よりも大幅に優れています。
論文参考訳（メタデータ） (2024-10-14T03:50:17Z)
MsMemoryGAN: A Multi-scale Memory GAN for Palm-vein Adversarial Purification [40.80205521005344]
本稿では,MsMemoryGANという新しい防衛モデルを提案する。 MsMemoryGANは、メモリに記録された通常のパターンのより少ない原型要素を使用することで、入力を再構築することを学ぶ。本手法では, 血管分類器が高い認識精度を達成できるため, 様々な逆方向の摂動を除去する。
論文参考訳（メタデータ） (2024-08-20T09:46:30Z)
SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning [63.93193829913252]
本稿では,リソース制限シナリオに対するSHERLと呼ばれる革新的なMETL戦略を提案する。初期経路では、中間出力は反冗長動作によって統合される。遅延ルートでは、最小限の遅延事前トレーニングされたレイヤを利用することで、メモリオーバーヘッドのピーク需要を軽減できる。
論文参考訳（メタデータ） (2024-07-10T10:22:35Z)
What do larger image classifiers memorise? [64.01325988398838]
トレーニング例は, モデルサイズにまたがって, 予想外の多彩な記憶軌跡を示す。有効で一般的なモデル圧縮手法である知識蒸留は,記憶を阻害する傾向があり,一般化も改善する。
論文参考訳（メタデータ） (2023-10-09T01:52:07Z)
Saliency-Guided Hidden Associative Replay for Continual Learning [13.551181595881326]
継続学習(Continuous Learning)は、人間の学習に似た一連のタスクを通じてニューラルネットワークをトレーニングすることに焦点を当てた、次世代AIの急成長する領域である。本稿では,継続的学習のためのSaliency Guided Hidden Associative Replayを提案する。この新しいフレームワークは、アソシエイトメモリをリプレイベースの戦略でシナジする。SHARCは主にスパースメモリエンコーディングを通じて、有能なデータセグメントをアーカイブする。
論文参考訳（メタデータ） (2023-10-06T15:54:12Z)
Analysis of the Memorization and Generalization Capabilities of AI Agents: Are Continual Learners Robust? [91.682459306359]
連続学習(CL)では、AIエージェントが動的環境下で非定常データストリームから学習する。本稿では,過去の知識を維持しつつ,動的環境への堅牢な一般化を実現するための新しいCLフレームワークを提案する。提案フレームワークの一般化と記憶性能を理論的に解析した。
論文参考訳（メタデータ） (2023-09-18T21:00:01Z)
Improving Task-free Continual Learning by Distributionally Robust Memory Evolution [9.345559196495746]
タスクフリー連続学習は、明示的なタスク定義なしで非定常データストリームを学習し、以前の知識を忘れないことを目的としている。既存の手法は、メモリデータ分布における高い不確実性を見落としている。本稿では,メモリデータ分散を動的に進化させるためのメモリ進化フレームワークを提案する。
論文参考訳（メタデータ） (2022-07-15T02:16:09Z)
A Model or 603 Exemplars: Towards Memory-Efficient Class-Incremental Learning [56.450090618578]
CIL(Class-Incremental Learning)は、この要件を満たすために、限られたメモリサイズでモデルをトレーニングすることを目的としている。モデルサイズを総予算にカウントし,メモリサイズに整合する手法を比較すると,保存モデルは常に機能しないことを示す。本稿では,メモリ効率のよい拡張可能なMOdelのための MEMO という,シンプルで効果的なベースラインを提案する。
論文参考訳（メタデータ） (2022-05-26T08:24:01Z)
Memory-Guided Semantic Learning Network for Temporal Sentence Grounding [55.31041933103645]
本稿では,TSGタスクにおいて稀に出現しないコンテンツを学習し,記憶するメモリ拡張ネットワークを提案する。 MGSL-Netは、クロスモーダル・インターアクション・モジュール、メモリ拡張モジュール、異種アテンション・モジュールの3つの主要な部分で構成されている。
論文参考訳（メタデータ） (2022-01-03T02:32:06Z)
Sequential memory improves sample and memory efficiency in Episodic Control [0.0]
最先端の強化学習アルゴリズムは、パフォーマンスを達成するために必要なエピソードの数が多いため、サンプル非効率である。哺乳類の海馬にインスパイアされたERLアルゴリズムは、通常、拡張メモリシステムを使用して過去の出来事から学習をブートストラップし、このサンプル非効率問題を克服する。ここでは、エピソードサンプリングの順序から得られる取得メモリ内容のバイアスを含めることで、エピソード制御アルゴリズムのサンプリングとメモリ効率が向上することを示す。
論文参考訳（メタデータ） (2021-12-29T18:42:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。