論文の概要: Unsupervised Visual Defect Detection with Score-Based Generative Model
- arxiv url: http://arxiv.org/abs/2211.16092v1
- Date: Tue, 29 Nov 2022 11:06:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 16:30:25.644954
- Title: Unsupervised Visual Defect Detection with Score-Based Generative Model
- Title(参考訳): スコアベース生成モデルによる教師なし視覚欠陥検出
- Authors: Yapeng Teng, Haoyang Li, Fuzhen Cai, Ming Shao, Siyu Xia
- Abstract要約: 我々は、教師なしの視覚的欠陥検出とローカライゼーションタスクに焦点をあてる。
近年のスコアベース生成モデルに基づく新しいフレームワークを提案する。
提案手法を複数のデータセット上で評価し,その有効性を実証する。
- 参考スコア(独自算出の注目度): 17.610722842950555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomaly Detection (AD), as a critical problem, has been widely discussed. In
this paper, we specialize in one specific problem, Visual Defect Detection
(VDD), in many industrial applications. And in practice, defect image samples
are very rare and difficult to collect. Thus, we focus on the unsupervised
visual defect detection and localization tasks and propose a novel framework
based on the recent score-based generative models, which synthesize the real
image by iterative denoising through stochastic differential equations (SDEs).
Our work is inspired by the fact that with noise injected into the original
image, the defects may be changed into normal cases in the denoising process
(i.e., reconstruction). First, based on the assumption that the anomalous data
lie in the low probability density region of the normal data distribution, we
explain a common phenomenon that occurs when reconstruction-based approaches
are applied to VDD: normal pixels also change during the reconstruction
process. Second, due to the differences in normal pixels between the
reconstructed and original images, a time-dependent gradient value (i.e.,
score) of normal data distribution is utilized as a metric, rather than
reconstruction loss, to gauge the defects. Third, a novel $T$ scales approach
is developed to dramatically reduce the required number of iterations,
accelerating the inference process. These practices allow our model to
generalize VDD in an unsupervised manner while maintaining reasonably good
performance. We evaluate our method on several datasets to demonstrate its
effectiveness.
- Abstract(参考訳): 重要な問題として,異常検出(AD)が広く議論されている。
本稿では,多くの産業応用において,視覚欠陥検出(VDD)という特定の問題に特化している。
そして実際には、欠陥画像のサンプルは非常に稀で収集が難しい。
そこで我々は,教師なしの視覚的欠陥検出と局所化タスクに着目し,確率微分方程式(SDE)を通して実像を反復分解して合成する,最近のスコアベース生成モデルに基づく新しいフレームワークを提案する。
我々の研究は、元の画像にノイズが注入された場合、欠陥はデノナイジング過程(すなわち再構成)の通常のケースに変化する可能性があるという事実に触発されている。
まず、異常データが正規データ分布の低確率密度領域にあるという仮定に基づいて、再構成に基づくアプローチをVDDに適用した場合に発生する一般的な現象を説明する。
第2に、再構成された画像と元の画像との正常画素の差から、正規データ分布の時間依存勾配値(すなわちスコア)を再構成損失ではなくメトリクスとして活用し、欠陥を計測する。
第3に、新しい$T$scalesアプローチが開発され、必要なイテレーション数を劇的に減らし、推論プロセスが加速される。
これらのプラクティスにより、我々のモデルは、合理的に優れた性能を維持しながら、教師なしの方法でVDDを一般化することができる。
提案手法を複数のデータセット上で評価し,その有効性を実証する。
関連論文リスト
- Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.784793380119806]
データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。
従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。
我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-04T14:28:52Z) - GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.78684630040313]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。
世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。
本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文 参考訳(メタデータ) (2024-06-11T17:27:23Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - CRADL: Contrastive Representations for Unsupervised Anomaly Detection
and Localization [2.8659934481869715]
医用画像における教師なし異常検出は、訓練中に異常データを必要とせず、任意の異常を検出し、位置決めすることを目的としている。
現在の最先端の手法のほとんどは、画像上で直接動作する潜在変数生成モデルを使用している。
コントラストプレテクストタスクで訓練されたエンコーダの低次元表現空間において,正規サンプルの分布を直接モデル化するCRADLを提案する。
論文 参考訳(メタデータ) (2023-01-05T16:07:49Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Denoising Diffusion Restoration Models [110.1244240726802]
Denoising Diffusion Restoration Models (DDRM) は効率的で教師なしの後方サンプリング手法である。
DDRMの汎用性を、超高解像度、デブロアリング、インペイント、カラー化のためにいくつかの画像データセットに示す。
論文 参考訳(メタデータ) (2022-01-27T20:19:07Z) - DASVDD: Deep Autoencoding Support Vector Data Descriptor for Anomaly
Detection [9.19194451963411]
半教師付き異常検出は、通常のデータに基づいて訓練されたモデルを用いて、通常のサンプルから異常を検出することを目的としている。
本稿では,自己エンコーダのパラメータを協調的に学習する手法であるDASVDDを提案する。
論文 参考訳(メタデータ) (2021-06-09T21:57:41Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - Anomaly localization by modeling perceptual features [3.04585143845864]
特徴拡張型VAEは、入力画像を画素空間や複数の異なる特徴空間で再構成することで訓練される。
MVTec異常検出およびローカライゼーションデータセットの最先端手法に対する明確な改善を実現する。
論文 参考訳(メタデータ) (2020-08-12T15:09:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。