論文の概要: Unified Unsupervised Anomaly Detection via Matching Cost Filtering
- arxiv url: http://arxiv.org/abs/2510.03363v2
- Date: Wed, 08 Oct 2025 12:00:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 14:21:18.186925
- Title: Unified Unsupervised Anomaly Detection via Matching Cost Filtering
- Title(参考訳): マッチングコストフィルタリングによる統一的教師なし異常検出
- Authors: Zhe Zhang, Mingxiu Cai, Gaochang Wu, Jing Zhang, Lingqiao Liu, Dacheng Tao, Tianyou Chai, Xiatian Zhu,
- Abstract要約: 教師なし異常検出(UAD)は、通常のトレーニングデータのみを用いて画像レベルの異常と画素レベルの異常を識別することを目的としている。
UADモデルの異常コスト量を補正するための汎用的なポストホック精錬フレームワークであるUnified Cost Filtering (UCF) を提案する。
- 参考スコア(独自算出の注目度): 113.43366521994396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised anomaly detection (UAD) aims to identify image- and pixel-level anomalies using only normal training data, with wide applications such as industrial inspection and medical analysis, where anomalies are scarce due to privacy concerns and cold-start constraints. Existing methods, whether reconstruction-based (restoring normal counterparts) or embedding-based (pretrained representations), fundamentally conduct image- or feature-level matching to generate anomaly maps. Nonetheless, matching noise has been largely overlooked, limiting their detection ability. Beyond earlier focus on unimodal RGB-based UAD, recent advances expand to multimodal scenarios, e.g., RGB--3D and RGB--Text, enabled by point cloud sensing and vision--language models. Despite shared challenges, these lines remain largely isolated, hindering a comprehensive understanding and knowledge transfer. In this paper, we advocate unified UAD for both unimodal and multimodal settings in the matching perspective. Under this insight, we present Unified Cost Filtering (UCF), a generic post-hoc refinement framework for refining anomaly cost volume of any UAD model. The cost volume is constructed by matching a test sample against normal samples from the same or different modalities, followed by a learnable filtering module with multi-layer attention guidance from the test sample, mitigating matching noise and highlighting subtle anomalies. Comprehensive experiments on 22 diverse benchmarks demonstrate the efficacy of UCF in enhancing a variety of UAD methods, consistently achieving new state-of-the-art results in both unimodal (RGB) and multimodal (RGB--3D, RGB--Text) UAD scenarios. Code and models will be released at https://github.com/ZHE-SAPI/CostFilter-AD.
- Abstract(参考訳): 教師なし異常検出(UAD)は、通常のトレーニングデータのみを用いて画像レベルの異常と画素レベルの異常を識別することを目的としており、産業検査や医療分析などの幅広い応用において、プライバシー上の懸念やコールドスタート制約により異常が不足している。
既存の手法では、再構成ベース(通常の表現を復元する)や埋め込みベース(事前制限された表現)のいずれでも、画像レベルのマッチングを根本的に実施して、異常マップを生成する。
それでも、一致したノイズはほとんど見落とされ、検出能力は制限されている。
従来は単調なRGBベースのUDDに重点を置いていたが、最近の進歩は、ポイントクラウドセンシングとビジョン言語モデルによって実現されたマルチモーダルシナリオ(例えば、RGB--3D、RGB-Text)にまで拡大している。
共有された課題にもかかわらず、これらの線は主として孤立しており、包括的な理解と知識の伝達を妨げる。
本稿では,一元的および多元的設定の統一的 UAD を,マッチングの観点から提唱する。
この知見に基づき,UADモデルの異常コスト量を補修するための汎用的なポストホック改質フレームワークであるUnified Cost Filtering (UCF)を提案する。
コスト容積は、同一又は異なるモダリティの通常のサンプルとテストサンプルをマッチングし、次いで、テストサンプルから多層注意誘導付き学習可能なフィルタリングモジュールを作成し、マッチングノイズを軽減し、微妙な異常を強調することによって構成される。
22の多種多様なベンチマークに関する総合的な実験は、UAD手法の強化におけるUCFの有効性を実証し、Unimodal (RGB) と Multimodal (RGB--3D, RGB-Text) UAD のシナリオにおいて、新しい最先端の結果を一貫して達成している。
コードとモデルはhttps://github.com/ZHE-SAPI/CostFilter-ADでリリースされる。
関連論文リスト
- CostFilter-AD: Enhancing Anomaly Detection through Matching Cost Filtering [64.24198178156627]
非教師付き異常検出(UAD)は、通常のサンプルに対して入力画像の異常マスクをローカライズしようとする。
古典的マッチングタスクから借用したコストフィルタリングの概念をUAD問題に導入する。
本稿では,複数の特徴層にまたがるアテンションクエリとして,入力観測によって導かれるコストボリュームフィルタリングネットワークを提案する。
論文 参考訳(メタデータ) (2025-05-02T14:52:34Z) - M3DM-NR: RGB-3D Noisy-Resistant Industrial Anomaly Detection via Multimodal Denoising [63.39134873744748]
既存の産業異常検出手法は主に、原始RGB画像を用いた教師なし学習に重点を置いている。
本稿では,CLIPの強力なマルチモーダル識別機能を利用する新しい耐雑音性M3DM-NRフレームワークを提案する。
M3DM-NRは3D-RGBマルチモーダルノイズ異常検出において最先端の手法より優れていた。
論文 参考訳(メタデータ) (2024-06-04T12:33:02Z) - Toward Generalist Anomaly Detection via In-context Residual Learning with Few-shot Sample Prompts [25.629973843455495]
Generalist Anomaly Detection (GAD)は、ターゲットデータにさらなるトレーニングを加えることなく、さまざまなアプリケーションドメインからさまざまなデータセットの異常を検出するために一般化可能な、単一の検出モデルをトレーニングすることを目的としている。
InCTRLと呼ばれるGADのための文脈内残差学習モデルを学習する新しい手法を提案する。
InCTRLは最高のパフォーマーであり、最先端の競合手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-03-11T08:07:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。