論文の概要: CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection
- arxiv url: http://arxiv.org/abs/2506.11772v1
- Date: Fri, 13 Jun 2025 13:30:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.809728
- Title: CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection
- Title(参考訳): CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection
- Authors: Byeongchan Lee, John Won, Seunghyun Lee, Jinwoo Shin,
- Abstract要約: 異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
- 参考スコア(独自算出の注目度): 54.85000884785013
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection is a complex problem due to the ambiguity in defining anomalies, the diversity of anomaly types (e.g., local and global defect), and the scarcity of training data. As such, it necessitates a comprehensive model capable of capturing both low-level and high-level features, even with limited data. To address this, we propose CLIPFUSION, a method that leverages both discriminative and generative foundation models. Specifically, the CLIP-based discriminative model excels at capturing global features, while the diffusion-based generative model effectively captures local details, creating a synergistic and complementary approach. Notably, we introduce a methodology for utilizing cross-attention maps and feature maps extracted from diffusion models specifically for anomaly detection. Experimental results on benchmark datasets (MVTec-AD, VisA) demonstrate that CLIPFUSION consistently outperforms baseline methods, achieving outstanding performance in both anomaly segmentation and classification. We believe that our method underscores the effectiveness of multi-modal and multi-model fusion in tackling the multifaceted challenges of anomaly detection, providing a scalable solution for real-world applications.
- Abstract(参考訳): 異常検出は、異常の定義の曖昧さ、異常の種類(例えば、局所的およびグローバル的欠陥)の多様性、トレーニングデータの不足による複雑な問題である。
そのため、限られたデータであっても、低レベルと高レベルの両方の特徴をキャプチャできる包括的なモデルが必要である。
そこで本研究では,識別的基盤モデルと生成的基盤モデルの両方を活用するCLIPFUSIONを提案する。
特に、CLIPに基づく識別モデルは、グローバルな特徴を捉えるのに優れ、拡散に基づく生成モデルは、局所的な詳細を効果的に捉え、相乗的で相補的なアプローチを生み出す。
特に,異常検出のための拡散モデルから抽出したクロスアテンションマップと特徴マップを利用する手法を提案する。
ベンチマークデータセット(MVTec-AD, VisA)の実験結果から、CLIPFUSIONはベースライン法を一貫して上回り、異常セグメンテーションと分類の両方において優れた性能を発揮することが示された。
本手法は, マルチモーダル・マルチモデル融合の有効性を実証し, 実世界のアプリケーションにスケーラブルなソリューションを提供する。
関連論文リスト
- Research on Anomaly Detection Methods Based on Diffusion Models [4.979627412142658]
異常検出は機械学習とデータマイニングの基本的な課題であり、サイバーセキュリティ、産業障害診断、臨床疾患モニタリングに重要な応用がある。
統計モデリングや機械学習ベースのアプローチといった従来の手法は、複雑で高次元のデータ分散を扱う際の課題に直面することが多い。
本稿では,拡散確率モデル(DPM)の長所を利用して,画像および音声データの異常を効果的に識別するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-08T11:19:08Z) - MeLIAD: Interpretable Few-Shot Anomaly Detection with Metric Learning and Entropy-based Scoring [2.394081903745099]
本稿では,新たな異常検出手法であるMeLIADを提案する。
MeLIADはメートル法学習に基づいており、真の異常の事前分布仮定に頼ることなく、設計による解釈可能性を達成する。
解釈可能性の定量的かつ定性的な評価を含む5つの公開ベンチマークデータセットの実験は、MeLIADが異常検出とローカライゼーション性能の改善を達成することを実証している。
論文 参考訳(メタデータ) (2024-09-20T16:01:43Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Multi-Class Anomaly Detection based on Regularized Discriminative
Coupled hypersphere-based Feature Adaptation [85.15324009378344]
本稿では,修正正規化識別変分オートエンコーダ(RD-VAE)によって得られたクラス識別特性を特徴抽出プロセスに組み込んだ新しいモデルを提案する。
提案した正規化識別型超球型特徴適応(RD-CFA)は,多クラス異常検出のための解である。
論文 参考訳(メタデータ) (2023-11-24T14:26:07Z) - LafitE: Latent Diffusion Model with Feature Editing for Unsupervised
Multi-class Anomaly Detection [12.596635603629725]
我々は,通常のデータのみにアクセス可能な場合に,複数のクラスに属するオブジェクトから異常を検出する統一モデルを開発した。
まず、生成的アプローチについて検討し、再構成のための潜伏拡散モデルについて検討する。
「拡散モデルの入力特徴空間を修正し、アイデンティティショートカットをさらに緩和する特徴編集戦略を導入する。」
論文 参考訳(メタデータ) (2023-07-16T14:41:22Z) - Spot The Odd One Out: Regularized Complete Cycle Consistent Anomaly Detector GAN [4.5123329001179275]
本研究では,GAN(Generative Adversarial Neural Network)のパワーを活用した,現実の応用における異常検出のための逆方向検出手法を提案する。
従来の手法は、あらゆる種類の異常に適用できないような、クラス単位での精度のばらつきに悩まされていた。
RCALADという手法は,この構造に新たな識別器を導入し,より効率的な学習プロセスを実現することで,この問題を解決しようとするものである。
論文 参考訳(メタデータ) (2023-04-16T13:05:39Z) - Meta-learning One-class Classifiers with Eigenvalue Solvers for
Supervised Anomaly Detection [55.888835686183995]
教師付き異常検出のためのニューラルネットワークに基づくメタラーニング手法を提案する。
提案手法は,既存の異常検出法や少数ショット学習法よりも優れた性能を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-01T01:43:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。