論文の概要: Towards a Phenomenological Understanding of Neural Networks: Data
- arxiv url: http://arxiv.org/abs/2305.00995v1
- Date: Mon, 1 May 2023 18:00:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-03 16:29:18.776744
- Title: Towards a Phenomenological Understanding of Neural Networks: Data
- Title(参考訳): ニューラルネットワークの現象論的理解に向けて:データ
- Authors: Samuel Tovey, Sven Krippendorf, Konstantin Nikolaou, Christian Holm
- Abstract要約: 集合変数に基づいて構築されたニューラルネットワークの理論(NN)は、科学者に各段階での学習プロセスをよりよく理解するためのツールを提供する。
本研究では、モデルに渡されるトレーニングデータに基づいて構築された経験的ニューラルネットワークカーネル(NTK)のエントロピーとトレースという2つの変数を紹介する。
我々は、開始エントロピー、NTKのトレース、および訓練後に計算されたモデルの一般化の相関関係が得られた。
- 参考スコア(独自算出の注目度): 1.2985510601654955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A theory of neural networks (NNs) built upon collective variables would
provide scientists with the tools to better understand the learning process at
every stage. In this work, we introduce two such variables, the entropy and the
trace of the empirical neural tangent kernel (NTK) built on the training data
passed to the model. We empirically analyze the NN performance in the context
of these variables and find that there exists correlation between the starting
entropy, the trace of the NTK, and the generalization of the model computed
after training is complete. This framework is then applied to the problem of
optimal data selection for the training of NNs. To this end, random network
distillation (RND) is used as a means of selecting training data which is then
compared with random selection of data. It is shown that not only does RND
select data-sets capable of outperforming random selection, but that the
collective variables associated with the RND data-sets are larger than those of
the randomly selected sets. The results of this investigation provide a stable
ground from which the selection of data for NN training can be driven by this
phenomenological framework.
- Abstract(参考訳): 集合変数に基づくニューラルネットワーク(NN)の理論は、科学者に各段階での学習プロセスをよりよく理解するためのツールを提供する。
本研究では、モデルに渡されるトレーニングデータに基づいて構築された経験的ニューラルネットワークカーネル(NTK)のエントロピーとトレースという2つの変数を紹介する。
これらの変数の文脈でnnの性能を実験的に解析し、開始エントロピーとntkのトレース、トレーニング終了後に計算されたモデルの一般化との間に相関があることを見出した。
この枠組みは、nnsのトレーニングのための最適なデータ選択問題に適用される。
この目的のために、ランダムネットワーク蒸留(RND)をトレーニングデータの選択手段として使用し、ランダムなデータ選択と比較する。
RNDが選択したデータセットは、ランダム選択よりも優れるだけでなく、RNDデータセットに関連する集合変数がランダム選択されたデータセットよりも大きいことが示されている。
本研究の結果は,この現象学的な枠組みにより,NNトレーニングのためのデータ選択を駆動できる安定した基盤を提供する。
関連論文リスト
- Unveiling the Power of Sparse Neural Networks for Feature Selection [60.50319755984697]
スパースニューラルネットワーク(SNN)は、効率的な特徴選択のための強力なツールとして登場した。
動的スパーストレーニング(DST)アルゴリズムで訓練されたSNNは、平均して50%以上のメモリと55%以上のFLOPを削減できることを示す。
以上の結果から,DSTアルゴリズムで訓練したSNNによる特徴選択は,平均して50ドル以上のメモリと55%のFLOPを削減できることがわかった。
論文 参考訳(メタデータ) (2024-08-08T16:48:33Z) - Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - Iterative self-transfer learning: A general methodology for response
time-history prediction based on small dataset [0.0]
本研究では,小さなデータセットに基づいてニューラルネットワークを学習するための反復的自己伝達学習手法を提案する。
提案手法は,小さなデータセットに対して,ほぼ一桁の精度でモデル性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2023-06-14T18:48:04Z) - How neural networks learn to classify chaotic time series [77.34726150561087]
本研究では,通常の逆カオス時系列を分類するために訓練されたニューラルネットワークの内部動作について検討する。
入力周期性とアクティベーション周期の関係は,LKCNNモデルの性能向上の鍵となる。
論文 参考訳(メタデータ) (2023-06-04T08:53:27Z) - Neural ODEs with Irregular and Noisy Data [8.349349605334316]
ノイズや不規則なサンプル測定を用いて微分方程式を学習する手法について議論する。
我々の方法論では、ディープニューラルネットワークとニューラル常微分方程式(ODE)アプローチの統合において、大きな革新が見られる。
ベクトル場を記述するモデルを学習するためのフレームワークは,雑音測定において非常に効果的である。
論文 参考訳(メタデータ) (2022-05-19T11:24:41Z) - MLDS: A Dataset for Weight-Space Analysis of Neural Networks [0.0]
MLDSは、注意深く制御されたパラメータを持つ何千ものトレーニングニューラルネットワークからなる新しいデータセットである。
このデータセットは、モデル-to-modelとモデル-to-training-data関係に関する新たな洞察を可能にする。
論文 参考訳(メタデータ) (2021-04-21T14:24:26Z) - Statistical model-based evaluation of neural networks [74.10854783437351]
ニューラルネットワーク(NN)の評価のための実験装置を開発する。
このセットアップは、NNs vis-a-vis minimum-mean-square-error (MMSE)パフォーマンス境界のベンチマークに役立つ。
これにより、トレーニングデータサイズ、データ次元、データ幾何学、ノイズ、トレーニング条件とテスト条件のミスマッチの影響をテストできます。
論文 参考訳(メタデータ) (2020-11-18T00:33:24Z) - Modeling from Features: a Mean-field Framework for Over-parameterized
Deep Neural Networks [54.27962244835622]
本稿では、オーバーパラメータ化ディープニューラルネットワーク(DNN)のための新しい平均場フレームワークを提案する。
このフレームワークでは、DNNは連続的な極限におけるその特徴に対する確率測度と関数によって表現される。
本稿では、標準DNNとResidual Network(Res-Net)アーキテクチャを通してフレームワークを説明する。
論文 参考訳(メタデータ) (2020-07-03T01:37:16Z) - Bayesian Graph Neural Networks with Adaptive Connection Sampling [62.51689735630133]
グラフニューラルネットワーク(GNN)における適応接続サンプリングのための統一的なフレームワークを提案する。
提案フレームワークは,深部GNNの過度なスムース化や過度に適合する傾向を緩和するだけでなく,グラフ解析タスクにおけるGNNによる不確実性の学習を可能にする。
論文 参考訳(メタデータ) (2020-06-07T07:06:35Z) - A study of local optima for learning feature interactions using neural
networks [4.94950858749529]
NNが比較的少量のトレーニングデータに基づいて訓練されるデータスターベッド方式について検討する。
XOR-likeデータ上のクロスエントロピー損失関数は多くの非等価局所最適値を持つことを示した。
実データセット上でのNNの性能はプルーニングにより改善できることを示す。
論文 参考訳(メタデータ) (2020-02-11T11:38:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。