論文の概要: Normality Prior Guided Multi-Semantic Fusion Network for Unsupervised Image Anomaly Detection
- arxiv url: http://arxiv.org/abs/2506.18544v1
- Date: Mon, 23 Jun 2025 11:54:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.966839
- Title: Normality Prior Guided Multi-Semantic Fusion Network for Unsupervised Image Anomaly Detection
- Title(参考訳): 教師なし画像異常検出のための正規化事前指導型マルチセマンティックフュージョンネットワーク
- Authors: Muhao Xu, Xueying Zhou, Xizhan Gao, Weiye Song, Guang Feng, Sijie Niu,
- Abstract要約: 教師なし異常検出のための新しい正規性事前誘導型マルチセマンティックフュージョンネットワークを提案する。
上記のマルチセマンティックな特徴を融合してデコーダへの入力として使用し、異常の復元を近似正規性に導く。
MVTec LOCO ADデータセット上でのSOTA性能は、ピクセルsPROが5.7%、イメージAUROCが2.6%向上している。
- 参考スコア(独自算出の注目度): 7.2755028046583226
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, detecting logical anomalies is becoming a more challenging task compared to detecting structural ones. Existing encoder decoder based methods typically compress inputs into low-dimensional bottlenecks on the assumption that the compression process can effectively suppress the transmission of logical anomalies to the decoder. However, logical anomalies present a particular difficulty because, while their local features often resemble normal semantics, their global semantics deviate significantly from normal patterns. Thanks to the generalisation capabilities inherent in neural networks, these abnormal semantic features can propagate through low-dimensional bottlenecks. This ultimately allows the decoder to reconstruct anomalous images with misleading fidelity. To tackle the above challenge, we propose a novel normality prior guided multi-semantic fusion network for unsupervised anomaly detection. Instead of feeding the compressed bottlenecks to the decoder directly, we introduce the multi-semantic features of normal samples into the reconstruction process. To this end, we first extract abstract global semantics of normal cases by a pre-trained vision-language network, then the learnable semantic codebooks are constructed to store representative feature vectors of normal samples by vector quantisation. Finally, the above multi-semantic features are fused and employed as input to the decoder to guide the reconstruction of anomalies to approximate normality. Extensive experiments are conducted to validate the effectiveness of our proposed method, and it achieves the SOTA performance on the MVTec LOCO AD dataset with improvements of 5.7% in pixel-sPRO and 2.6% in image-AUROC. The source code is available at https://github.com/Xmh-L/NPGMF.
- Abstract(参考訳): 近年, 論理異常の検出は, 構造異常の検出よりも難しい課題となっている。
既存のエンコーダデコーダベースの手法では、圧縮プロセスがデコーダへの論理異常の伝達を効果的に抑制できるという仮定に基づいて、入力を低次元のボトルネックに圧縮する。
しかし、局所的な特徴は通常の意味論とよく似ているが、大域的な意味論は通常のパターンとは大きく異なるため、論理的異常は特に困難である。
ニューラルネットワークに固有の一般化機能のおかげで、これらの異常な意味的特徴は低次元のボトルネックを通じて伝播することができる。
これにより、デコーダは誤認された忠実さで異常な画像を再構成することができる。
上記の課題に対処するために、教師なし異常検出のためのガイド付きマルチセマンティックフュージョンネットワークを新たに提案する。
圧縮されたボトルネックを直接デコーダに供給する代わりに、通常のサンプルのマルチセマンティックな特徴を再構成プロセスに導入する。
そこで,我々はまず,事前学習された視覚言語ネットワークを用いて,通常事例の抽象的グローバルな意味論を抽出し,学習可能な意味コードブックを構築し,通常のサンプルの特徴ベクトルをベクトル量子化により記憶する。
最後に、上記のマルチセマンティックな特徴を融合してデコーダへの入力として使用し、異常の復元を近似正規性に導く。
提案手法の有効性を検証するために大規模な実験を行い, MVTec LOCO ADデータセット上でのSOTA性能を5.7%, Image-AUROC 2.6%改善した。
ソースコードはhttps://github.com/Xmh-L/NPGMFで入手できる。
関連論文リスト
- Anomaly Detection with Adversarially Learned Perturbations of Latent
Space [9.473040033926264]
異常検出は、正常なデータの分布に適合しないサンプルを特定することである。
本研究では,2つの競合するコンポーネント,Adversarial Distorter と Autoencoder で構成される対角的フレームワークを設計した。
提案手法は,画像およびビデオデータセットの異常検出において,既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-03T19:32:00Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Memory-augmented Adversarial Autoencoders for Multivariate Time-series
Anomaly Detection with Deep Reconstruction and Prediction [4.033624665609417]
本稿では,時系列の非教師付き異常検出手法であるMemAAEを提案する。
2つの補完的プロキシタスク、再構築と予測を共同でトレーニングすることにより、複数のタスクによる異常検出が優れた性能を得ることを示す。
MemAAEは4つの公開データセットで総合F1スコアの0.90を達成し、最高のベースラインである0.02を上回っている。
論文 参考訳(メタデータ) (2021-10-15T18:29:05Z) - DASVDD: Deep Autoencoding Support Vector Data Descriptor for Anomaly
Detection [9.19194451963411]
半教師付き異常検出は、通常のデータに基づいて訓練されたモデルを用いて、通常のサンプルから異常を検出することを目的としている。
本稿では,自己エンコーダのパラメータを協調的に学習する手法であるDASVDDを提案する。
論文 参考訳(メタデータ) (2021-06-09T21:57:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。