論文の概要: Preventing Deterioration of Classification Accuracy in Predictive Coding
Networks
- arxiv url: http://arxiv.org/abs/2208.07114v1
- Date: Mon, 15 Aug 2022 10:54:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-16 14:34:10.701199
- Title: Preventing Deterioration of Classification Accuracy in Predictive Coding
Networks
- Title(参考訳): 予測符号化ネットワークにおける分類精度の劣化防止
- Authors: Paul F Kinghorn, Beren Millidge, Christopher L Buckley
- Abstract要約: 予測符号化ネットワーク(PCN)は、世界の生成モデルを学ぶことを目的としている。
観察を前提として、この生成モデルは逆転してこれらの観測の原因を推測することができる。
PCNのトレーニングでは、推論精度がピークに達し、さらなるトレーニングで減少する、顕著な病理がしばしば観察される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predictive Coding Networks (PCNs) aim to learn a generative model of the
world. Given observations, this generative model can then be inverted to infer
the causes of those observations. However, when training PCNs, a noticeable
pathology is often observed where inference accuracy peaks and then declines
with further training. This cannot be explained by overfitting since both
training and test accuracy decrease simultaneously. Here we provide a thorough
investigation of this phenomenon and show that it is caused by an imbalance
between the speeds at which the various layers of the PCN converge. We
demonstrate that this can be prevented by regularising the weight matrices at
each layer: by restricting the relative size of matrix singular values, we
allow the weight matrix to change but restrict the overall impact which a layer
can have on its neighbours. We also demonstrate that a similar effect can be
achieved through a more biologically plausible and simple scheme of just
capping the weights.
- Abstract(参考訳): 予測符号化ネットワーク(PCN)は、世界の生成モデルを学ぶことを目的としている。
この生成モデルは、観測された結果の原因を推測するために逆転することができる。
しかし、PCNのトレーニングでは、推論精度がピークに達し、さらなるトレーニングで低下する、顕著な病理がしばしば観察される。
トレーニングとテストの精度が同時に低下するため、オーバーフィッティングでは説明できない。
ここでは、この現象を徹底的に研究し、PCNの様々な層が収束する速度間の不均衡に起因することを示す。
行列特異値の相対的大きさを制限することによって、重み行列が変化することを許容するが、その近傍にレイヤが持つ全体的な影響は制限される。
また, 同様の効果は, より生物学的に有理で単純な方法で, 単に重みを包み込むだけで達成できることを示した。
関連論文リスト
- SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - RMP-Loss: Regularizing Membrane Potential Distribution for Spiking
Neural Networks [26.003193122060697]
生物学に触発されたモデルの1つとしてスパイキングニューラルネットワーク(SNN)が最近注目を集めている。
本稿では,正則化膜電位損失(RMP-Loss)を提案し,量子化誤差に直接関係する分布をスパイクに近い範囲に調整する。
論文 参考訳(メタデータ) (2023-08-13T14:59:27Z) - SGD and Weight Decay Secretly Minimize the Rank of Your Neural Network [8.79431718760617]
ミニバッチSGDとウェイト崩壊によるトレーニングは、ウェイト行列のランク最小化へのバイアスを引き起こす。
このバイアスは、より小さなバッチサイズ、より高い学習率、より強いウェイト崩壊によってより顕著になる。
このバイアスと一般化の関係を実証的に検討し、テスト性能に限界効果があることを見出した。
論文 参考訳(メタデータ) (2022-06-12T17:06:35Z) - Benign Overfitting in Two-layer Convolutional Neural Networks [90.75603889605043]
2層畳み込みニューラルネットワーク(CNN)の訓練における良性過剰適合現象の検討
信号対雑音比が一定の条件を満たすと、勾配降下により訓練された2層CNNが任意に小さな訓練と試験損失を達成できることを示す。
一方、この条件が保たない場合、オーバーフィッティングは有害となり、得られたCNNは一定レベルのテスト損失しか達成できない。
論文 参考訳(メタデータ) (2022-02-14T07:45:51Z) - Efficient and Robust Classification for Sparse Attacks [34.48667992227529]
我々は、画像認識、自然言語処理、マルウェア検出の領域において効果的な攻撃として示されてきた$ell$-normで束縛された摂動を考える。
我々は,「トランケーション」と「アドリアル・トレーニング」を組み合わせた新しい防衛手法を提案する。
得られた洞察に触発され、これらのコンポーネントをニューラルネットワーク分類器に拡張する。
論文 参考訳(メタデータ) (2022-01-23T21:18:17Z) - Tightening the Biological Constraints on Gradient-Based Predictive
Coding [1.90365714903665]
予測符号化(英: Predictive coding、PC)は、皮質機能の理論である。
本稿では,生物学的制約に適合する勾配型PCモデルを改良する。
修正PCネットワークは、修正されていないPCモデルやバックプロパゲーションで訓練されたネットワークと同様に、MNISTデータでも、あるいはほぼ同様に動作することを示す。
論文 参考訳(メタデータ) (2021-04-30T17:56:00Z) - Feature Purification: How Adversarial Training Performs Robust Deep
Learning [66.05472746340142]
ニューラルネットワークのトレーニングプロセス中に隠れた重みに、特定の小さな密度の混合物が蓄積されることが、敵の例の存在の原因の1つであることを示す。
この原理を説明するために、CIFAR-10データセットの両実験と、ある自然な分類タスクに対して、ランダムな勾配勾配勾配を用いた2層ニューラルネットワークをトレーニングすることを証明する理論的結果を示す。
論文 参考訳(メタデータ) (2020-05-20T16:56:08Z) - Revisiting Initialization of Neural Networks [72.24615341588846]
ヘッセン行列のノルムを近似し, 制御することにより, 層間における重みのグローバルな曲率を厳密に推定する。
Word2Vec と MNIST/CIFAR 画像分類タスクの実験により,Hessian ノルムの追跡が診断ツールとして有用であることが確認された。
論文 参考訳(メタデータ) (2020-04-20T18:12:56Z) - Overfitting in adversarially robust deep learning [86.11788847990783]
トレーニングセットへの過度な適合は、実際には、逆向きの堅牢なトレーニングにおいて、非常に大きなロバストなパフォーマンスを損なうことを示す。
また, 2重降下曲線のような効果は, 逆向きに訓練されたモデルでもまだ起こるが, 観測された過度なオーバーフィッティングを説明できないことを示す。
論文 参考訳(メタデータ) (2020-02-26T15:40:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。