論文の概要: INP-Former++: Advancing Universal Anomaly Detection via Intrinsic Normal Prototypes and Residual Learning
- arxiv url: http://arxiv.org/abs/2506.03660v2
- Date: Mon, 30 Jun 2025 13:33:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 15:08:39.542494
- Title: INP-Former++: Advancing Universal Anomaly Detection via Intrinsic Normal Prototypes and Residual Learning
- Title(参考訳): INP-Former++: 固有正規型と残留学習による普遍的異常検出の改善
- Authors: Wei Luo, Haiming Yao, Yunkang Cao, Qiyu Chen, Ang Gao, Weiming Shen, Wenyong Yu,
- Abstract要約: 異常検出は産業検査や診断に不可欠である。
既存のメソッドは通常、トレーニングセットからの通常の参照と比較する'テストイメージに依存します。
Intrinsic Normal Prototypes(INP)を直接抽出する新しい手法であるINP-Formerを提案する。
- 参考スコア(独自算出の注目度): 4.40689369060115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomaly detection (AD) is essential for industrial inspection and medical diagnosis, yet existing methods typically rely on ``comparing'' test images to normal references from a training set. However, variations in appearance and positioning often complicate the alignment of these references with the test image, limiting detection accuracy. We observe that most anomalies manifest as local variations, meaning that even within anomalous images, valuable normal information remains. We argue that this information is useful and may be more aligned with the anomalies since both the anomalies and the normal information originate from the same image. Therefore, rather than relying on external normality from the training set, we propose INP-Former, a novel method that extracts Intrinsic Normal Prototypes (INPs) directly from the test image. Specifically, we introduce the INP Extractor, which linearly combines normal tokens to represent INPs. We further propose an INP Coherence Loss to ensure INPs can faithfully represent normality for the testing image. These INPs then guide the INP-guided Decoder to reconstruct only normal tokens, with reconstruction errors serving as anomaly scores. Additionally, we propose a Soft Mining Loss to prioritize hard-to-optimize samples during training. INP-Former achieves state-of-the-art performance in single-class, multi-class, and few-shot AD tasks across MVTec-AD, VisA, and Real-IAD, positioning it as a versatile and universal solution for AD. Remarkably, INP-Former also demonstrates some zero-shot AD capability. Furthermore, we propose a soft version of the INP Coherence Loss and enhance INP-Former by incorporating residual learning, leading to the development of INP-Former++. The proposed method significantly improves detection performance across single-class, multi-class, semi-supervised, few-shot, and zero-shot settings.
- Abstract(参考訳): 異常検出(AD)は産業検査や診断に欠かせないが、既存の手法では「比較」テストイメージをトレーニングセットからの通常の参照に頼っているのが一般的である。
しかしながら、外観や位置のバリエーションは、これらの参照とテスト画像とのアライメントを複雑にし、検出精度を制限していることが多い。
その結果,ほとんどの異常は局所的な変化であり,異常画像においても貴重な正規情報が残っている。
我々は,この情報が有用であり,同一画像から得られる異常情報と正常情報の両方から,異常情報とより一致している可能性があると論じる。
そこで,本研究では,トレーニングセットから外部の正規性に頼るのではなく,テストイメージから直接内在する正規プロトタイプ(INP)を抽出する新しい手法であるINP-Formerを提案する。
具体的には、通常のトークンを線形に組み合わせてINPを表すINP Extractorを紹介する。
さらに、INPがテスト画像の正常性を忠実に表現できるように、INPコヒーレンス損失を提案する。
これらのINPはINP誘導デコーダを誘導して通常のトークンのみを再構築し、再構成エラーは異常スコアとして機能する。
さらに,トレーニング中のサンプルの最適化を困難にするためのソフトマイニングロスを提案する。
INP-FormerはMVTec-AD、VisA、Real-IADにまたがる単一クラス、複数クラス、少数ショットのADタスクで最先端のパフォーマンスを実現し、ADの汎用的で普遍的なソリューションとして位置づけている。
注目すべきは、INP-Formerは、いくつかのゼロショットAD機能もデモしていることだ。
さらに,INPコヒーレンスロスのソフトバージョンを提案し,残留学習を取り入れたINP-Formerを拡張し,INP-Former++の開発に繋がる。
提案手法は, 単一クラス, 複数クラス, 半教師付き, 少数ショット, ゼロショット設定における検出性能を著しく向上する。
関連論文リスト
- Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。
本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。
提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection [6.443312201906293]
INP-Formerは、テスト画像から直接固有の正規プロトタイプ(INP)を抽出する新しい方法である。
INP-Formerは、単一クラス、複数クラス、少数ショットADタスクで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-04T09:10:32Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - Toward Generalist Anomaly Detection via In-context Residual Learning with Few-shot Sample Prompts [25.629973843455495]
Generalist Anomaly Detection (GAD)は、ターゲットデータにさらなるトレーニングを加えることなく、さまざまなアプリケーションドメインからさまざまなデータセットの異常を検出するために一般化可能な、単一の検出モデルをトレーニングすることを目的としている。
InCTRLと呼ばれるGADのための文脈内残差学習モデルを学習する新しい手法を提案する。
InCTRLは最高のパフォーマーであり、最先端の競合手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-03-11T08:07:46Z) - Normality Learning-based Graph Anomaly Detection via Multi-Scale
Contrastive Learning [61.57383634677747]
グラフ異常検出(GAD)は、機械学習やデータマイニングにおいて注目を集めている。
本稿では,マルチスケールコントラスト学習ネットワーク(NLGAD,略語)による正規性学習に基づくGADフレームワークを提案する。
特に,提案アルゴリズムは,最先端手法と比較して検出性能(最大5.89%のAUCゲイン)を向上させる。
論文 参考訳(メタデータ) (2023-09-12T08:06:04Z) - PatchNR: Learning from Small Data by Patch Normalizing Flow
Regularization [57.37911115888587]
正規化フローに基づく画像の逆問題に対する変分モデリングのための正規化器を提案する。
patchNRと呼ばれる我々の正規化器は、ごく少数の画像のパッチで学習したフローを正規化します。
論文 参考訳(メタデータ) (2022-05-24T12:14:26Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - Constrained Contrastive Distribution Learning for Unsupervised Anomaly
Detection and Localisation in Medical Images [23.79184121052212]
UAD(Unsupervised Anomaly Detection)は、通常の(すなわち健康的な)画像でのみ1クラスの分類器を学習する。
異常検出のための制約コントラスト分布学習(Constrained Contrastive Distribution Learning for Anomaly Detection, CCD)を提案する。
本手法は,3種類の大腸内視鏡および底部検診データセットにおいて,最先端のUADアプローチよりも優れている。
論文 参考訳(メタデータ) (2021-03-05T01:56:58Z) - Modeling the Distribution of Normal Data in Pre-Trained Deep Features
for Anomaly Detection [2.9864637081333085]
画像中の異常検出(AD)は、標準からかなり逸脱した画像や画像のサブ構造を特定することを指す。
本研究では,大きな自然画像データセット上での識別モデルにより学習された深い特徴表現が,正規性を記述するのに適していることを示す。
論文 参考訳(メタデータ) (2020-05-28T16:43:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。