論文の概要: DevPrompt: Deviation-Based Prompt Learning for One-Normal ShotImage Anomaly Detection
- arxiv url: http://arxiv.org/abs/2601.15453v1
- Date: Wed, 21 Jan 2026 20:35:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.413632
- Title: DevPrompt: Deviation-Based Prompt Learning for One-Normal ShotImage Anomaly Detection
- Title(参考訳): DevPrompt: ワンノーマルショット画像異常検出のための偏差に基づくプロンプト学習
- Authors: Morteza Poudineh, Marc Lalonde,
- Abstract要約: FNSAD (Few-normal shot anomaly detection) は、画像内の異常領域を検出することを目的としている。
最近のアプローチでは、CLIPのような視覚言語モデルとプロンプトベースの学習を利用して、画像とテキストの特徴を整合させる。
本稿では,視覚言語モデルのセマンティックパワーと,偏差に基づくスコアリングの統計的信頼性を統合した偏差誘導型即時学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-normal shot anomaly detection (FNSAD) aims to detect abnormal regions in images using only a few normal training samples, making the task highly challenging due to limited supervision and the diversity of potential defects. Recent approaches leverage vision-language models such as CLIP with prompt-based learning to align image and text features. However, existing methods often exhibit weak discriminability between normal and abnormal prompts and lack principled scoring mechanisms for patch-level anomalies. We propose a deviation-guided prompt learning framework that integrates the semantic power of vision-language models with the statistical reliability of deviation-based scoring. Specifically, we replace fixed prompt prefixes with learnable context vectors shared across normal and abnormal prompts, while anomaly-specific suffix tokens enable class-aware alignment. To enhance separability, we introduce a deviation loss with Top-K Multiple Instance Learning (MIL), modeling patch-level features as Gaussian deviations from the normal distribution. This allows the network to assign higher anomaly scores to patches with statistically significant deviations, improving localization and interpretability. Experiments on the MVTecAD and VISA benchmarks demonstrate superior pixel-level detection performance compared to PromptAD and other baselines. Ablation studies further validate the effectiveness of learnable prompts, deviation-based scoring, and the Top-K MIL strategy.
- Abstract(参考訳): FNSAD(Few-normal shot anomaly Detection)は、少数の通常のトレーニングサンプルを使用して画像の異常領域を検出することを目的としており、限られた監督と潜在的な欠陥の多様性のためにタスクを非常に困難にしている。
最近のアプローチでは、CLIPのような視覚言語モデルとプロンプトベースの学習を利用して、画像とテキストの特徴を整合させる。
しかし、既存の手法では、通常のプロンプトと異常なプロンプトの識別性が弱く、パッチレベルの異常のスコアリング機構が欠如していることが多い。
本稿では,視覚言語モデルのセマンティックパワーと,偏差に基づくスコアリングの統計的信頼性を統合した偏差誘導型即時学習フレームワークを提案する。
具体的には、固定されたプロンプトプレフィックスを通常のプロンプトと異常なプロンプト間で共有される学習可能なコンテキストベクトルに置き換える一方、異常固有接尾辞トークンはクラス認識アライメントを可能にする。
分離性を高めるため,Top-K Multiple Instance Learning (MIL) による偏差損失を導入し,パッチレベルの特徴を正規分布からのガウス偏差としてモデル化する。
これにより、ネットワークは統計的に重要なずれのあるパッチにより高い異常スコアを割り当て、ローカライゼーションと解釈可能性を改善することができる。
MVTecADとVISAベンチマークの実験では、PmptADや他のベースラインと比較してピクセルレベルの検出性能が優れている。
アブレーション研究は、学習可能なプロンプト、偏差に基づくスコア、Top-K MIL戦略の有効性をさらに検証する。
関連論文リスト
- Defect-aware Hybrid Prompt Optimization via Progressive Tuning for Zero-Shot Multi-type Anomaly Detection and Segmentation [12.030059666003972]
分散シフト下でのゼロショット多重型およびバイナリ異常検出とセグメンテーションのプログレッシブチューニングに基づく,Defect-aware Prompt Optimizationのための新しいアプローチであるDAPOを紹介する。
本手法は,固定されたテキストアンカーと学習可能なトークン埋め込みの両方で,ハイブリッドな欠陥認識プロンプトを学習することにより,異常関連画像特徴と対応するテキストセマンティクスを一致させる。
論文 参考訳(メタデータ) (2025-12-10T09:19:17Z) - Foundation Visual Encoders Are Secretly Few-Shot Anomaly Detectors [58.75916798814376]
FoundADと呼ばれる数発の異常検出装置を開発した。
画像中の異常量は学習した埋め込みの差と直接相関する。
簡単な演算子は、画像中の分布外領域を特徴付け識別する異常検出の有効なツールとして機能する。
論文 参考訳(メタデータ) (2025-10-02T11:53:20Z) - Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [109.72772150095646]
FAPromptは、精密なZSADのためのきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
産業的欠陥と医療的異常の両方をカバーする19の実世界のデータセットの実験は、FAPromptが画像レベルのZSADタスクとピクセルレベルのZSADタスクの両方で最先端の手法を大幅に上回っていることを実証している。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - FiLo: Zero-Shot Anomaly Detection by Fine-Grained Description and High-Quality Localization [31.854923603517264]
本稿では,新しいゼロショット異常検出法であるFiLoを提案する。
FiLoは、適応学習されたFG-Des(FG-Des)と位置強調された高品質なローカライゼーション(HQ-Loc)の2つのコンポーネントから構成される。
MVTecやVisAのようなデータセットの実験結果から、FiLoは検出とローカライゼーションの両方においてZSADの性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2024-04-21T14:22:04Z) - Learning Prompt-Enhanced Context Features for Weakly-Supervised Video
Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。
本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。
提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文 参考訳(メタデータ) (2023-06-26T06:45:16Z) - Hard-normal Example-aware Template Mutual Matching for Industrial Anomaly Detection [78.734927709231]
異常検出器は、クエリー画像の未知の欠陥を検出し、ローカライズするために工業製造で広く使われている。
これらの検出器は異常のないサンプルで訓練され、ほとんどの通常のサンプルと区別された異常を成功させた。
しかし、ハードノーマルな例は、ほとんどの通常のサンプルから遠く離れており、しばしば既存の方法によって異常と誤認される。
論文 参考訳(メタデータ) (2023-03-28T17:54:56Z) - Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。
提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。
我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文 参考訳(メタデータ) (2021-08-01T14:33:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。