論文の概要: Mitigating Neural Network Overconfidence with Logit Normalization
- arxiv url: http://arxiv.org/abs/2205.09310v1
- Date: Thu, 19 May 2022 03:45:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-21 06:30:50.860746
- Title: Mitigating Neural Network Overconfidence with Logit Normalization
- Title(参考訳): 論理正規化によるニューラルネットワーク過信の軽減
- Authors: Hongxin Wei, Renchunzi Xie, Hao Cheng, Lei Feng, Bo An, Yixuan Li
- Abstract要約: ニューラルネットワークは、イン・オブ・ディストリビューション・インプットとアウト・オブ・ディストリビューション・インプットの両方に対して異常に高い信頼をもたらす。
この問題はLogit Normalization(LogitNorm)を通じて緩和可能であることを示す。
本手法は, トレーニング中にロジットのノルムが増加し, 過度に信頼される結果となるという分析に動機付けられている。
- 参考スコア(独自算出の注目度): 37.106755943446515
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Detecting out-of-distribution inputs is critical for safe deployment of
machine learning models in the real world. However, neural networks are known
to suffer from the overconfidence issue, where they produce abnormally high
confidence for both in- and out-of-distribution inputs. In this work, we show
that this issue can be mitigated through Logit Normalization (LogitNorm) -- a
simple fix to the cross-entropy loss -- by enforcing a constant vector norm on
the logits in training. Our method is motivated by the analysis that the norm
of the logit keeps increasing during training, leading to overconfident output.
Our key idea behind LogitNorm is thus to decouple the influence of output's
norm during network optimization. Trained with LogitNorm, neural networks
produce highly distinguishable confidence scores between in- and
out-of-distribution data. Extensive experiments demonstrate the superiority of
LogitNorm, reducing the average FPR95 by up to 42.30% on common benchmarks.
- Abstract(参考訳): 分散インプットの検出は、現実世界における機械学習モデルの安全なデプロイに不可欠である。
しかし、ニューラルネットワークは自信過剰な問題に苦しむことが知られており、分布内入力と分布外入力の両方に対して異常に高い信頼感を生み出す。
本研究では,ロジット正規化(Logit Normalization, LogitNorm)により,ロジットに一定のベクトルノルムを課すことにより,この問題を緩和できることを示す。
本手法は,トレーニング中にロジットの標準値が上昇し,自信過剰なアウトプットにつながるという分析結果に動機づけられている。
LogitNormの主な考え方は、ネットワーク最適化中に出力のノルムの影響を分離することです。
logitnormでトレーニングされたニューラルネットワークは、分布内データと分布外データの間で、高度に識別可能な信頼度スコアを生成する。
広範な実験によりlogitnormの優位性が示され、一般的なベンチマークで平均的なfpr95を最大42.30%削減した。
関連論文リスト
- Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - Benign Overfitting in Deep Neural Networks under Lazy Training [72.28294823115502]
データ分布が適切に分離された場合、DNNは分類のためのベイズ最適テスト誤差を達成できることを示す。
よりスムーズな関数との補間により、より一般化できることを示す。
論文 参考訳(メタデータ) (2023-05-30T19:37:44Z) - Comparative Analysis of Interval Reachability for Robust Implicit and
Feedforward Neural Networks [64.23331120621118]
我々は、暗黙的ニューラルネットワーク(INN)の堅牢性を保証するために、区間到達可能性分析を用いる。
INNは暗黙の方程式をレイヤとして使用する暗黙の学習モデルのクラスである。
提案手法は, INNに最先端の区間境界伝搬法を適用するよりも, 少なくとも, 一般的には, 有効であることを示す。
論文 参考訳(メタデータ) (2022-04-01T03:31:27Z) - Distribution Mismatch Correction for Improved Robustness in Deep Neural
Networks [86.42889611784855]
正規化法は ノイズや入力の腐敗に関して 脆弱性を増大させる
本稿では,各層の活性化分布に適応する非教師なし非パラメトリック分布補正法を提案する。
実験により,提案手法は画像劣化の激しい影響を効果的に低減することを示した。
論文 参考訳(メタデータ) (2021-10-05T11:36:25Z) - The Compact Support Neural Network [6.47243430672461]
本研究では, 標準ドット生成物に基づくニューロンとRBFニューロンを, 形状パラメータの2つの極端な場合として提示する。
トレーニングされた標準ニューラルネットワークから始めて、必要な値まで形状パラメータを徐々に増加させることで、そのようなニューロンによるニューラルネットワークのトレーニングの難しさを回避する方法を示す。
論文 参考訳(メタデータ) (2021-04-01T06:08:09Z) - Performance Bounds for Neural Network Estimators: Applications in Fault
Detection [2.388501293246858]
ニューラルネットワークの堅牢性を定量化し,モデルに基づく異常検知器の構築とチューニングを行った。
チューニングでは,通常動作で想定される誤報発生率の上限を具体的に提示する。
論文 参考訳(メタデータ) (2021-03-22T19:23:08Z) - Non-Singular Adversarial Robustness of Neural Networks [58.731070632586594]
小さな入力摂動に対する過敏性のため、アドリヤルロバスト性はニューラルネットワークにとって新たな課題となっている。
我々は,データ入力とモデル重みの共振レンズを用いて,ニューラルネットワークの非特異な対角性の概念を定式化する。
論文 参考訳(メタデータ) (2021-02-23T20:59:30Z) - Input Hessian Regularization of Neural Networks [31.941188983286207]
本稿では,Hessian演算子-ノルム正規化を用いたディープニューラルネットワークの学習アルゴリズムを提案する。
我々は、新しい正規化器が実際に実現可能であること、さらに入力勾配正規化よりもニューラルネットワークの堅牢性を高めることを示している。
論文 参考訳(メタデータ) (2020-09-14T16:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。