Fugu-MT 論文翻訳(概要): DASH: Warm-Starting Neural Network Training in Stationary Settings without Loss of Plasticity

論文の概要: DASH: Warm-Starting Neural Network Training in Stationary Settings without Loss of Plasticity

arxiv url: http://arxiv.org/abs/2410.23495v2
Date: Fri, 01 Nov 2024 09:49:24 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:42.593153
Title: DASH: Warm-Starting Neural Network Training in Stationary Settings without Loss of Plasticity
Title（参考訳）: DASH: プラスティック性を損なわない定置環境におけるウォームスタートニューラルネットワークトレーニング
Authors: Baekrok Shin, Junsoo Oh, Hanseul Cho, Chulhee Yun,
Abstract要約: 我々は,実世界のニューラルネットワークトレーニングを模擬したフレームワークを開発し,静止データ上での暖房開始時の可塑性損失の主な原因としてノイズ記憶を同定する。そこで本研究では,学習した特徴を保ちながら雑音を選択的に忘れることによって可塑性損失を軽減することを目的としたDASH(Direction-Aware SHrinking)を提案する。
参考スコア（独自算出の注目度）: 11.624569521079426
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Warm-starting neural network training by initializing networks with previously learned weights is appealing, as practical neural networks are often deployed under a continuous influx of new data. However, it often leads to loss of plasticity, where the network loses its ability to learn new information, resulting in worse generalization than training from scratch. This occurs even under stationary data distributions, and its underlying mechanism is poorly understood. We develop a framework emulating real-world neural network training and identify noise memorization as the primary cause of plasticity loss when warm-starting on stationary data. Motivated by this, we propose Direction-Aware SHrinking (DASH), a method aiming to mitigate plasticity loss by selectively forgetting memorized noise while preserving learned features. We validate our approach on vision tasks, demonstrating improvements in test accuracy and training efficiency.
Abstract（参考訳）: 従来から学んだ重み付きネットワークの初期化によるウォームスタートニューラルネットワークトレーニングは、実用的なニューラルネットワークが新しいデータの継続的な流入下で展開されることがしばしばあるため、魅力的である。しかし、しばしば可塑性が失われ、ネットワークは新たな情報を学ぶ能力を失い、結果としてゼロからトレーニングするよりも一般化が悪くなる。これは定常的なデータ分布でも発生し、その基盤となるメカニズムはよく理解されていない。我々は,実世界のニューラルネットワークトレーニングを模擬したフレームワークを開発し,静止データ上での暖房開始時の可塑性損失の主な原因としてノイズ記憶を同定する。そこで本研究では,学習した特徴を保ちながら記憶された雑音を選択的に忘れることにより,可塑性損失を軽減することを目的としたDASH(Direction-Aware SHrinking)を提案する。視覚タスクに対する我々のアプローチを検証し、テスト精度とトレーニング効率の改善を実証する。

関連論文リスト

What Can Grokking Teach Us About Learning Under Nonstationarity? [21.031486400628854]
連続的な学習問題では、データストリームの変化に応じてニューラルネットワークの学習表現のコンポーネントを上書きする必要がある。ニューラルネットワークは、しばしばプライマリーバイアスを示します。早期トレーニングデータによって、ネットワークが後続のタスクを一般化する能力を妨げます。特徴学習力学の出現は, グルーキング現象を引き起こすことが知られている。
論文参考訳（メタデータ） (2025-07-26T20:51:24Z)
A simple theory for training response of deep neural networks [0.0]
ディープニューラルネットワークは、トレーニングデータセットの入力と出力の関係をモデル化する強力な方法を提供します。トレーニング段階、アクティベーション機能、トレーニング方法に基づいて、トレーニング応答がいくつかの異なる要因から成り立っていることを示す。さらに,ネットワークの脆弱性を生じさせるトレーニング力学の効果として,特徴空間の削減を示す。
論文参考訳（メタデータ） (2024-05-07T07:20:15Z)
Disentangling the Causes of Plasticity Loss in Neural Networks [55.23250269007988]
可塑性の喪失は複数の独立したメカニズムに分解できることを示す。種々の非定常学習タスクにおいて, 層正規化と重み劣化の組み合わせは, 可塑性維持に極めて有効であることを示す。
論文参考訳（メタデータ） (2024-02-29T00:02:33Z)
Simple and Effective Transfer Learning for Neuro-Symbolic Integration [50.592338727912946]
この問題の潜在的な解決策はNeuro-Symbolic Integration (NeSy)であり、ニューラルアプローチとシンボリック推論を組み合わせる。これらの手法のほとんどは、認識をシンボルにマッピングするニューラルネットワークと、下流タスクの出力を予測する論理的論理的推論を利用する。それらは、緩やかな収束、複雑な知覚タスクの学習困難、局所的なミニマへの収束など、いくつかの問題に悩まされている。本稿では,これらの問題を改善するための簡易かつ効果的な方法を提案する。
論文参考訳（メタデータ） (2024-02-21T15:51:01Z)
Set-Based Training for Neural Network Verification [8.97708612393722]
小さな入力摂動はニューラルネットワークの出力に大きな影響を与える。安全クリティカルな環境では、入力はノイズの多いセンサーデータを含むことが多い。我々は、堅牢なニューラルネットワークをトレーニングして正式な検証を行う、エンドツーエンドのセットベーストレーニング手順を採用している。
論文参考訳（メタデータ） (2024-01-26T15:52:41Z)
Understanding plasticity in neural networks [41.79540750236036]
可塑性は、ニューラルネットワークが新しい情報に反応して予測を素早く変更する能力である。深層ニューラルネットワークは、比較的単純な学習問題であっても、トレーニングの過程で可塑性を失うことが知られている。
論文参考訳（メタデータ） (2023-03-02T18:47:51Z)
Neural networks trained with SGD learn distributions of increasing complexity [78.30235086565388]
勾配降下法を用いてトレーニングされたニューラルネットワークは、まず低次入力統計を用いて入力を分類する。その後、トレーニング中にのみ高次の統計を利用する。本稿では,DSBと他の単純度バイアスとの関係について論じ,学習における普遍性の原理にその意味を考察する。
論文参考訳（メタデータ） (2022-11-21T15:27:22Z)
Critical Learning Periods for Multisensory Integration in Deep Networks [112.40005682521638]
ニューラルネットワークが様々な情報源からの情報を統合する能力は、トレーニングの初期段階において、適切な相関した信号に晒されることに批判的になることを示す。臨界周期は、訓練されたシステムとその学習された表現の最終性能を決定づける、複雑で不安定な初期過渡的ダイナミクスから生じることを示す。
論文参考訳（メタデータ） (2022-10-06T23:50:38Z)
Reconstructing Training Data from Trained Neural Networks [42.60217236418818]
いくつかのケースでは、トレーニングデータのかなりの部分が、実際にトレーニングされたニューラルネットワーク分類器のパラメータから再構成可能であることを示す。本稿では,勾配に基づくニューラルネットワークの学習における暗黙バイアスに関する最近の理論的結果から,新たな再構成手法を提案する。
論文参考訳（メタデータ） (2022-06-15T18:35:16Z)
Explain to Not Forget: Defending Against Catastrophic Forgetting with XAI [10.374979214803805]
破滅的な忘れは、ニューラルネットワークが新しい情報を与えられたときの過去の知識を完全に忘れてしまう現象を記述している。我々は、ニューラルネットワークが新しいデータをトレーニングする際に、以前のタスクで既に学んだ情報を保持するために、レイヤーワイズ関連伝播を利用する、トレーニングと呼ばれる新しいトレーニングアルゴリズムを提案する。我々の手法は、ニューラルネットワーク内の古いタスクの知識をうまく保持するだけでなく、他の最先端のソリューションよりもリソース効率が良い。
論文参考訳（メタデータ） (2022-05-04T08:00:49Z)
Overcoming Catastrophic Forgetting beyond Continual Learning: Balanced Training for Neural Machine Translation [15.309573393914462]
ニューラルネットワークは、動的データ分布から複数のタスクを逐次学習する際に、これまで学んだ知識を忘れがちである。この問題はtextitcatastrophic forgettingと呼ばれ、ニューラルネットワークの継続的な学習における根本的な課題である。本研究では,特定のデータ注文に基づいて訓練された教師モデルを動的に更新し,学生モデルに補完的知識を反復的に提供するための補完的オンライン知識蒸留(COKD)を提案する。
論文参考訳（メタデータ） (2022-03-08T08:08:45Z)
Learning Fast and Slow for Online Time Series Forecasting [76.50127663309604]
Fast and Slow Learning Networks (FSNet)は、オンライン時系列予測のための総合的なフレームワークである。 FSNetは、最近の変更への迅速な適応と、同様の古い知識の取得のバランスを取る。私たちのコードは公開されます。
論文参考訳（メタデータ） (2022-02-23T18:23:07Z)
Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文参考訳（メタデータ） (2022-02-01T17:11:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。