論文の概要: Efficient remedies for outlier detection with variational autoencoders
- arxiv url: http://arxiv.org/abs/2108.08760v1
- Date: Thu, 19 Aug 2021 16:00:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-20 14:40:50.795187
- Title: Efficient remedies for outlier detection with variational autoencoders
- Title(参考訳): 変分オートエンコーダを用いた外乱検出の効率化
- Authors: Kushal Chauhan, Pradeep Shenoy, Manish Gupta and Devarajan Sridharan
- Abstract要約: 深層生成モデルによって計算される類似度は、ラベルなしデータによる外れ値検出の候補メトリックである。
理論的に定位された補正は、VAE推定値による鍵バイアスを容易に改善することを示す。
また,VAEのアンサンブル上で計算される確率の分散により,ロバストな外乱検出が可能となることを示す。
- 参考スコア(独自算出の注目度): 8.80692072928023
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep networks often make confident, yet incorrect, predictions when tested
with outlier data that is far removed from their training distributions.
Likelihoods computed by deep generative models are a candidate metric for
outlier detection with unlabeled data. Yet, previous studies have shown that
such likelihoods are unreliable and can be easily biased by simple
transformations to input data. Here, we examine outlier detection with
variational autoencoders (VAEs), among the simplest class of deep generative
models. First, we show that a theoretically-grounded correction readily
ameliorates a key bias with VAE likelihood estimates. The bias correction is
model-free, sample-specific, and accurately computed with the Bernoulli and
continuous Bernoulli visible distributions. Second, we show that a well-known
preprocessing technique, contrast normalization, extends the effectiveness of
bias correction to natural image datasets. Third, we show that the variance of
the likelihoods computed over an ensemble of VAEs also enables robust outlier
detection. We perform a comprehensive evaluation of our remedies with nine
(grayscale and natural) image datasets, and demonstrate significant advantages,
in terms of both speed and accuracy, over four other state-of-the-art methods.
Our lightweight remedies are biologically inspired and may serve to achieve
efficient outlier detection with many types of deep generative models.
- Abstract(参考訳): 深層ネットワークは、トレーニングディストリビューションから遠く離れた外れ値データでテストした場合、自信を持って、誤った予測をすることが多い。
深層生成モデルによって計算される確率はラベルなしデータを用いた異常検出の候補指標である。
しかし、以前の研究では、そのような可能性は信頼性がなく、入力データへの単純な変換によって容易にバイアスを負うことが示されている。
本稿では,変分オートエンコーダ (VAE) による外乱検出について,最も単純な生成モデルとして検討する。
まず,理論的な接地補正により,vae推定値による鍵バイアスが軽減されることを示す。
バイアス補正はモデルフリーでサンプル固有であり、ベルヌーイ分布と連続ベルヌーイ分布で正確に計算される。
第2に,よく知られた前処理手法であるコントラスト正規化が,バイアス補正の有効性を自然画像データセットに拡張することを示す。
第3に,vaesのアンサンブル上で計算される確率のばらつきがロバストな外乱検出を可能にすることを示す。
我々は,9つの画像データセットによる治療の包括的評価を行い,他の4つの最先端手法と比較して,スピードと精度の両面で大きな利点を示した。
私たちの軽量な治療は生物学的にインスパイアされ、多くのタイプの深層生成モデルで効率的な異常検出を達成するのに役立ちます。
関連論文リスト
- Positive Difference Distribution for Image Outlier Detection using
Normalizing Flows and Contrastive Data [2.9005223064604078]
例えば、標準的なログライクリーフトレーニングによる正規化フローは、外れ値スコアとして不十分である。
本稿では,外乱検出のための非ラベル付き補助データセットと確率的外乱スコアを提案する。
これは、分布内と対照的な特徴密度の間の正規化正の差を学ぶことと等価であることを示す。
論文 参考訳(メタデータ) (2022-08-30T07:00:46Z) - Shaken, and Stirred: Long-Range Dependencies Enable Robust Outlier
Detection with PixelCNN++ [6.736754991468853]
PixelCNN++のバイアスは、主にローカル依存に基づく予測から生じる。
低レベルのバイアスを緩和し、長距離依存関係の寄与を分離する。
5つのグレースケールと6つの自然画像データセットを用いて、我々のアプローチを広範囲にテストし、それらが最先端の異常検出を達成または超えることを示す。
論文 参考訳(メタデータ) (2022-08-29T13:17:22Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Robust Out-of-Distribution Detection on Deep Probabilistic Generative
Models [0.06372261626436676]
アウト・オブ・ディストリビューション(OOD)検出は機械学習システムにおいて重要な課題である。
深い確率的生成モデルは、データサンプルの可能性を推定することによって、OODの検出を容易にする。
本稿では,外周露光を伴わない新しい検出指標を提案する。
論文 参考訳(メタデータ) (2021-06-15T06:36:10Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。