論文の概要: Learning to Detect Multi-class Anomalies with Just One Normal Image Prompt
- arxiv url: http://arxiv.org/abs/2505.09264v1
- Date: Wed, 14 May 2025 10:25:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.419785
- Title: Learning to Detect Multi-class Anomalies with Just One Normal Image Prompt
- Title(参考訳): 1つの正常画像プロンプトによる複数クラス異常検出の学習
- Authors: Bin-Bin Gao,
- Abstract要約: 通常の特徴を再構成し,ただ1つの正常画像プロンプト(OneNIP)で異常特徴を復元する,シンプルで効果的な手法を提案する。
以前の研究とは対照的に、OneNIPは1つの通常の画像プロンプトで初めて異常を再構築または復元し、統一された異常検出性能を効果的に向上させる。
OneNIPは、MVTec、BTAD、VisAの3つの業界異常検出ベンチマークにおいて、以前の方法よりも優れている。
- 参考スコア(独自算出の注目度): 4.887838886202545
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised reconstruction networks using self-attention transformers have achieved state-of-the-art performance for multi-class (unified) anomaly detection with a single model. However, these self-attention reconstruction models primarily operate on target features, which may result in perfect reconstruction for both normal and anomaly features due to high consistency with context, leading to failure in detecting anomalies. Additionally, these models often produce inaccurate anomaly segmentation due to performing reconstruction in a low spatial resolution latent space. To enable reconstruction models enjoying high efficiency while enhancing their generalization for unified anomaly detection, we propose a simple yet effective method that reconstructs normal features and restores anomaly features with just One Normal Image Prompt (OneNIP). In contrast to previous work, OneNIP allows for the first time to reconstruct or restore anomalies with just one normal image prompt, effectively boosting unified anomaly detection performance. Furthermore, we propose a supervised refiner that regresses reconstruction errors by using both real normal and synthesized anomalous images, which significantly improves pixel-level anomaly segmentation. OneNIP outperforms previous methods on three industry anomaly detection benchmarks: MVTec, BTAD, and VisA. The code and pre-trained models are available at https://github.com/gaobb/OneNIP.
- Abstract(参考訳): 自己アテンション変換器を用いた教師なし再構成ネットワークは, 単一モデルによる複数クラス(統一)異常検出の最先端性能を実現している。
しかし、これらの自己注意再構成モデルは、主にターゲット特徴に基づいて動作し、コンテキストとの整合性が高いため、正常特徴と異常特徴の両方を完璧に再構成する可能性があるため、異常検出に失敗する可能性がある。
さらに、これらのモデルは低空間分解能潜時空間で再構成を行うため、しばしば不正確な異常セグメンテーションを生成する。
統一された異常検出のための一般化を向上しつつ,高効率な再構成モデルを実現するために,通常の特徴を再構成し,ただ一つの正常画像プロンプト(One Normal Image Prompt, OneNIP)で異常特徴を復元する,シンプルで効果的な手法を提案する。
以前の研究とは対照的に、OneNIPは1つの通常の画像プロンプトで初めて異常を再構築または復元し、統一された異常検出性能を効果的に向上させる。
さらに、実際の正規画像と合成画像の両方を用いて再構成誤りを抑える教師付き精細化器を提案し、画素レベルの異常セグメンテーションを大幅に改善した。
OneNIPは、MVTec、BTAD、VisAの3つの業界異常検出ベンチマークにおいて、以前の方法よりも優れている。
コードと事前訓練されたモデルはhttps://github.com/gaobb/OneNIPで入手できる。
関連論文リスト
- Attention-Guided Perturbation for Unsupervised Image Anomaly Detection [4.084209435209347]
本稿では,注意誘導摂動ネットワーク(AGPNet)という再構成フレームワークを提案する。
AGPNetは、トレーニング中に注意マスクで案内された摂動を追加することを学ぶ。
MVTec-AD、VisA、MVTec-3Dをカバーするいくつかの人気のあるベンチマークで実験が行われた。
論文 参考訳(メタデータ) (2024-08-14T12:12:43Z) - Detecting Anomalies in Dynamic Graphs via Memory enhanced Normality [39.476378833827184]
動的グラフにおける異常検出は、グラフ構造と属性の時間的進化によって大きな課題となる。
時空間記憶強調グラフオートエンコーダ(STRIPE)について紹介する。
STRIPEは、AUCスコアが5.8%改善し、トレーニング時間が4.62倍速く、既存の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-03-14T02:26:10Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - FAIR: Frequency-aware Image Restoration for Industrial Visual Anomaly
Detection [4.705841907301398]
周波数対応画像復元(英: Frequency-Aware Image Restoration, FAIR)は、高周波成分から画像を復元する、新しい自己教師付き画像復元タスクである。
FAIRは、様々な欠陥検出データセットで高い効率で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-09-13T16:28:43Z) - Two-stream Decoder Feature Normality Estimating Network for Industrial
Anomaly Detection [4.772323272202286]
正常な特徴と異常な特徴の両方を学習するための2ストリームデコーダネットワーク(TSDN)を提案する。
また、異常な特徴を排除し、異常領域の高品質な再構成を防止するための特徴正規度推定器(FNE)を提案する。
論文 参考訳(メタデータ) (2023-02-20T06:46:09Z) - Reconstruction from edge image combined with color and gradient
difference for industrial surface anomaly detection [3.42097787126957]
我々は、元のRGB画像をそのグレー値エッジ(EdgRec)から再構成する新しい再構成ネットワークを提案する。
本手法は, 検定のためのベンチマークMVTec AD (97.8%, ローカライゼーションのための97.7%, AUROC) において, 競合する結果を得る。
論文 参考訳(メタデータ) (2022-10-26T05:21:43Z) - ADTR: Anomaly Detection Transformer with Feature Reconstruction [40.68590890351697]
通常のサンプルからの事前知識のみによる異常検出が注目されている。
既存のCNNベースの画素再構成アプローチには2つの懸念がある。
本稿では,事前学習した特徴の再構成にトランスフォーマを適用するために,ADTR(Anomaly Detection TRansformer)を提案する。
論文 参考訳(メタデータ) (2022-09-05T08:01:27Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。