論文の概要: CNC: Cross-modal Normality Constraint for Unsupervised Multi-class Anomaly Detection
- arxiv url: http://arxiv.org/abs/2501.00346v1
- Date: Tue, 31 Dec 2024 08:43:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:17:25.828136
- Title: CNC: Cross-modal Normality Constraint for Unsupervised Multi-class Anomaly Detection
- Title(参考訳): CNC: 教師なしマルチクラス異常検出のためのクロスモーダル正規性制約
- Authors: Xiaolei Wang, Xiaoyang Wang, Huihui Bai, Eng Gee Lim, Jimin Xiao,
- Abstract要約: 本稿では,クラスに依存しない学習可能なプロンプトを利用して,デコードされた特徴を正規のテキスト表現へ導く手法を提案する。
本手法は,MVTec AD と VisA のデータセット上での競合性能を実現し,その性能を実証する。
- 参考スコア(独自算出の注目度): 34.675120608542265
- License:
- Abstract: Existing unsupervised distillation-based methods rely on the differences between encoded and decoded features to locate abnormal regions in test images. However, the decoder trained only on normal samples still reconstructs abnormal patch features well, degrading performance. This issue is particularly pronounced in unsupervised multi-class anomaly detection tasks. We attribute this behavior to over-generalization(OG) of decoder: the significantly increasing diversity of patch patterns in multi-class training enhances the model generalization on normal patches, but also inadvertently broadens its generalization to abnormal patches. To mitigate OG, we propose a novel approach that leverages class-agnostic learnable prompts to capture common textual normality across various visual patterns, and then apply them to guide the decoded features towards a normal textual representation, suppressing over-generalization of the decoder on abnormal patterns. To further improve performance, we also introduce a gated mixture-of-experts module to specialize in handling diverse patch patterns and reduce mutual interference between them in multi-class training. Our method achieves competitive performance on the MVTec AD and VisA datasets, demonstrating its effectiveness.
- Abstract(参考訳): 既存の教師なし蒸留法は、テスト画像の異常領域を検出するために、符号化された特徴と復号された特徴の違いに依存している。
しかし、通常のサンプルのみを訓練したデコーダは、異常なパッチの特徴をよく再構築し、性能を低下させる。
この問題は、教師なしのマルチクラス異常検出タスクにおいて特に顕著である。
マルチクラストレーニングにおけるパッチパターンの多様性の顕著な増大は,通常のパッチに対するモデル一般化を促進させる一方で,その一般化を異常なパッチに不注意に拡張する。
OGを緩和するために、クラスに依存しない学習可能なプロンプトを利用して、様々な視覚パターンをまたいだ共通テキストの正規性を捕捉し、それらの特徴を正規テキスト表現へ誘導し、異常パターンに対するデコーダの過度な一般化を抑える新しいアプローチを提案する。
さらに,多種多様なパッチパターンを扱うことや,マルチクラストレーニングにおける相互干渉を低減することを目的としたゲート・オブ・エキスパート・モジュールも導入した。
本手法は,MVTec AD と VisA のデータセット上での競合性能を実現し,その性能を実証する。
関連論文リスト
- Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - Prior Normality Prompt Transformer for Multi-class Industrial Image Anomaly Detection [6.865429486202104]
マルチクラス異常検出のためのPNPT(Presideor Normality Prompt Transformer)を導入する。
PNPTは戦略的に通常の意味論を取り入れ、「アイデンティティマッピング」問題を緩和する。
これにより、事前の正規性プロンプトを再構築プロセスに統合し、二重ストリームモデルを生成する。
論文 参考訳(メタデータ) (2024-06-17T13:10:04Z) - USD: Unsupervised Soft Contrastive Learning for Fault Detection in Multivariate Time Series [6.055410677780381]
本研究では,データ拡張とソフトコントラスト学習の組み合わせを導入し,より正確に状態行動の多面的特性を捉えることを目的としている。
この二重戦略は、正常な状態と異常な状態を区別するモデルの能力を著しく向上させ、複数のデータセットと設定で障害検出性能が著しく向上する。
論文 参考訳(メタデータ) (2024-05-25T14:48:04Z) - Continuous Memory Representation for Anomaly Detection [24.58611060347548]
CRADは「連続的」メモリ内の正常な特徴を表現するための新しい異常検出手法である。
MVTec ADデータセットを用いた評価では、CRADは、マルチクラス統一異常検出におけるエラーの65.0%を削減し、従来の最先端手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-02-28T12:38:44Z) - Generating and Reweighting Dense Contrastive Patterns for Unsupervised
Anomaly Detection [59.34318192698142]
我々は、先行のない異常発生パラダイムを導入し、GRADと呼ばれる革新的な教師なし異常検出フレームワークを開発した。
PatchDiffは、様々な種類の異常パターンを効果的に公開する。
MVTec ADとMVTec LOCOデータセットの両方の実験も、前述の観測をサポートする。
論文 参考訳(メタデータ) (2023-12-26T07:08:06Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Siamese Transition Masked Autoencoders as Uniform Unsupervised Visual
Anomaly Detector [4.33060257697635]
本稿では,様々な視覚異常検出タスクを均一に処理するための,Samese Transition Masked Autoencoders (ST-MAE) と呼ばれる新しいフレームワークを提案する。
我々の深い特徴遷移スキームは、通常のパターンを抽出する非教師付きセマンティックな自己監督タスクをもたらす。
論文 参考訳(メタデータ) (2022-11-01T09:45:49Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Self-Supervised Predictive Convolutional Attentive Block for Anomaly
Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。
我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。
画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文 参考訳(メタデータ) (2021-11-17T13:30:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。