論文の概要: Unsupervised anomaly localization using VAE and beta-VAE
- arxiv url: http://arxiv.org/abs/2005.10686v1
- Date: Tue, 19 May 2020 21:58:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 13:31:23.697930
- Title: Unsupervised anomaly localization using VAE and beta-VAE
- Title(参考訳): VAEとβ-VAEを用いた教師なし異常位置推定
- Authors: Leixin Zhou, Wenxiang Deng, Xiaodong Wu
- Abstract要約: 変分自動エンコーダ(VAE)はデータ分散の教師なし学習において大きな可能性を示している。
通常の画像に基づいてトレーニングされたVAEは、通常の画像のみを再構成することができ、画像内の異常画素の局所化を可能にすることが期待されている。
本稿では、医用画像におけるエネルギーベース投影は、自然画像ほど有用ではないと論じる。
- 参考スコア(独自算出の注目度): 0.39901365062418304
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Variational Auto-Encoders (VAEs) have shown great potential in the
unsupervised learning of data distributions. An VAE trained on normal images is
expected to only be able to reconstruct normal images, allowing the
localization of anomalous pixels in an image via manipulating information
within the VAE ELBO loss. The ELBO consists of KL divergence loss (image-wise)
and reconstruction loss (pixel-wise). It is natural and straightforward to use
the later as the predictor. However, usually local anomaly added to a normal
image can deteriorate the whole reconstructed image, causing segmentation using
only naive pixel errors not accurate. Energy based projection was proposed to
increase the reconstruction accuracy of normal regions/pixels, which achieved
the state-of-the-art localization accuracy on simple natural images. Another
possible predictors are ELBO and its components gradients with respect to each
pixels. Previous work claimed that KL gradient is a robust predictor. In this
paper, we argue that the energy based projection in medical imaging is not as
useful as on natural images. Moreover, we observe that the robustness of KL
gradient predictor totally depends on the setting of the VAE and dataset. We
also explored the effect of the weight of KL loss within beta-VAE and predictor
ensemble in anomaly localization.
- Abstract(参考訳): 変分自動エンコーダ(VAE)はデータ分散の教師なし学習において大きな可能性を示している。
通常の画像で訓練されたvaeは、正常な画像のみを再構成することができ、vae elboロス内の情報を操作することで画像内の異常画素を局在化することができる。
ELBOはKL分散損失(画像ワイド)と再構成損失(画素ワイド)からなる。
後者を予測子として使うのは自然で簡単です。
しかし、通常、通常の画像に局所的な異常を加えると、全体の再構成画像が劣化し、単純なピクセルエラーのみを用いた分割が正確でない。
通常の領域/画素の再構成精度を向上させるために, エネルギーに基づく投影法が提案され, 単純自然画像における最先端の局在化精度が得られた。
もう1つの可能な予測器はELBOであり、各ピクセルに対するそのコンポーネント勾配である。
以前の研究は、KL勾配は堅牢な予測器であると主張した。
本稿では,医療画像におけるエネルギーに基づく投影は,自然画像ほど有用ではないと主張する。
さらに, KL勾配予測器の頑健性は, VAEとデータセットの設定に大きく依存している。
また,β-VAEにおけるKL損失の重み付けと予測アンサンブルが異常局在に及ぼす影響についても検討した。
関連論文リスト
- GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.78684630040313]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。
世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。
本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文 参考訳(メタデータ) (2024-06-11T17:27:23Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Generative Diffusion Prior for Unified Image Restoration and Enhancement [62.76390152617949]
既存の画像復元法は、主に自然画像の後方分布を利用する。
教師なしサンプリング方式で後部分布を効果的にモデル化するための生成拡散優先(GDP)を提案する。
GDPは、線形逆問題、非線形問題、ブラインド問題を解くために、プレトレインデノナイジング拡散生成モデル(DDPM)を利用する。
論文 参考訳(メタデータ) (2023-04-03T16:52:43Z) - Industrial and Medical Anomaly Detection Through Cycle-Consistent
Adversarial Networks [0.6554326244334868]
産業用および医療用画像に対する新しい異常検出(AD)手法を提案する。
提案手法では,Cycle-Generative Adrial Networks (Cycle-GAN) を用いて正規語から正規語への翻訳を行う。
その結果, 正負の制約をゼロとする精度が, 最先端の手法と比較して高いことがわかった。
論文 参考訳(メタデータ) (2023-02-10T10:25:12Z) - Unsupervised Visual Defect Detection with Score-Based Generative Model [17.610722842950555]
我々は、教師なしの視覚的欠陥検出とローカライゼーションタスクに焦点をあてる。
近年のスコアベース生成モデルに基づく新しいフレームワークを提案する。
提案手法を複数のデータセット上で評価し,その有効性を実証する。
論文 参考訳(メタデータ) (2022-11-29T11:06:29Z) - ADTR: Anomaly Detection Transformer with Feature Reconstruction [40.68590890351697]
通常のサンプルからの事前知識のみによる異常検出が注目されている。
既存のCNNベースの画素再構成アプローチには2つの懸念がある。
本稿では,事前学習した特徴の再構成にトランスフォーマを適用するために,ADTR(Anomaly Detection TRansformer)を提案する。
論文 参考訳(メタデータ) (2022-09-05T08:01:27Z) - GradViT: Gradient Inversion of Vision Transformers [83.54779732309653]
我々は,視力変換器(ViT)の勾配に基づく逆攻撃に対する脆弱性を実証する。
自然に見える画像にランダムノイズを最適化するGradViTという手法を提案する。
元の(隠された)データに対する前例のない高い忠実さと近接性を観察する。
論文 参考訳(メタデータ) (2022-03-22T17:06:07Z) - Low-Light Image Enhancement with Normalizing Flow [92.52290821418778]
本稿では,この一対多の関係を正規化フローモデルを用いてモデル化する。
低照度画像/特徴を条件として取り、通常露光される画像の分布をガウス分布にマッピングすることを学ぶ可逆ネットワーク。
既存のベンチマークデータセットによる実験結果から,提案手法はより定量的,質的な結果を得ることができ,照度が良く,ノイズやアーティファクトが小さく,色も豊かになることがわかった。
論文 参考訳(メタデータ) (2021-09-13T12:45:08Z) - Energy-Based Anomaly Detection and Localization [6.423239719448169]
本稿では,視覚異常検出と局所化問題の統一解への最初の進歩を概観する。
エネルギーベースモデル(EBM)からの密度推定を、異常画像から正常画像を識別するために使用できる正常スコアとして採用します。
空間的局所化に加えて,グラデーションマップの簡易な処理により,新たな正規性スコアが得られることを示した。
論文 参考訳(メタデータ) (2021-05-07T13:49:17Z) - Probabilistic 3D surface reconstruction from sparse MRI information [58.14653650521129]
スパース2次元MR画像データとアレータティック不確実性予測から3次元表面再構成を同時に行うための新しい確率論的深層学習手法を提案する。
本手法は,3つの準直交MR画像スライスから,限られたトレーニングセットから大きな表面メッシュを再構成することができる。
論文 参考訳(メタデータ) (2020-10-05T14:18:52Z) - Iterative energy-based projection on a normal data manifold for anomaly
localization [3.785123406103385]
本稿では,オートエンコーダを学習した正規データ多様体上で異常データを投影する手法を提案する。
オートエンコーダの入力を反復的に更新することにより、オートエンコーダボトルネックに起因する高周波情報の損失を回避できる。
論文 参考訳(メタデータ) (2020-02-10T13:35:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。