論文の概要: AnomalySD: Few-Shot Multi-Class Anomaly Detection with Stable Diffusion Model
- arxiv url: http://arxiv.org/abs/2408.01960v1
- Date: Sun, 4 Aug 2024 08:33:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-06 17:41:24.176801
- Title: AnomalySD: Few-Shot Multi-Class Anomaly Detection with Stable Diffusion Model
- Title(参考訳): AnomalySD:安定拡散モデルを用いたFew-Shot Multi-class Anomaly Detection
- Authors: Zhenyu Yan, Qingqing Fang, Wenxi Lv, Qinliang Su,
- Abstract要約: 異常検出は製造業において重要な課題であり、製品の欠陥部分を特定することを目的としている。
ほとんどの産業的異常検出法は、訓練に十分な正規データが存在することを前提としている。
本稿では,安定拡散モデルを用いた数発のマルチクラス異常検出フレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.942354689705658
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection is a critical task in industrial manufacturing, aiming to identify defective parts of products. Most industrial anomaly detection methods assume the availability of sufficient normal data for training. This assumption may not hold true due to the cost of labeling or data privacy policies. Additionally, mainstream methods require training bespoke models for different objects, which incurs heavy costs and lacks flexibility in practice. To address these issues, we seek help from Stable Diffusion (SD) model due to its capability of zero/few-shot inpainting, which can be leveraged to inpaint anomalous regions as normal. In this paper, a few-shot multi-class anomaly detection framework that adopts Stable Diffusion model is proposed, named AnomalySD. To adapt SD to anomaly detection task, we design different hierarchical text descriptions and the foreground mask mechanism for fine-tuning SD. In the inference stage, to accurately mask anomalous regions for inpainting, we propose multi-scale mask strategy and prototype-guided mask strategy to handle diverse anomalous regions. Hierarchical text prompts are also utilized to guide the process of inpainting in the inference stage. The anomaly score is estimated based on inpainting result of all masks. Extensive experiments on the MVTec-AD and VisA datasets demonstrate the superiority of our approach. We achieved anomaly classification and segmentation results of 93.6%/94.8% AUROC on the MVTec-AD dataset and 86.1%/96.5% AUROC on the VisA dataset under multi-class and one-shot settings.
- Abstract(参考訳): 異常検出は製造業において重要な課題であり、製品の欠陥部分を特定することを目的としている。
ほとんどの産業的異常検出法は、訓練に十分な正規データが存在することを前提としている。
この仮定は、ラベル付けやデータプライバシポリシのコストのために当てはまらないかもしれない。
さらに、メインストリームの手法では、さまざまなオブジェクトに対して、重いコストを発生させ、実際は柔軟性に欠ける、ベズークモデルをトレーニングする必要があります。
これらの問題に対処するために、我々は、通常のように不規則な領域に活用できるゼロ/フェーショットの塗布能力により、安定拡散モデル(SD)の助けを求める。
本稿では,安定拡散モデルを用いた数発のマルチクラス異常検出フレームワークAnomalySDを提案する。
異常検出タスクにSDを適応させるため、我々は異なる階層的なテキスト記述と、微調整SDのための前景マスク機構を設計する。
推測段階では, 塗装用の異常領域を正確にマスキングするために, 多様な異常領域を扱うためのマルチスケールマスク戦略とプロトタイプ誘導マスク戦略を提案する。
階層的なテキストプロンプトも、推論段階でのインペインティングのプロセスを導くために使われる。
異常スコアは、すべてのマスクの塗装結果に基づいて推定される。
MVTec-ADとVisAデータセットに関する大規模な実験は、我々のアプローチの優位性を示している。
MVTec-ADデータセットでは93.6%/94.8% AUROC,VisAデータセットでは86.1%/96.5% AUROC,マルチクラスおよびワンショット設定では86.1%/96.5% AUROCの異常分類とセグメンテーション結果を得た。
関連論文リスト
- AnomalyNCD: Towards Novel Anomaly Class Discovery in Industrial Scenarios [16.77348120041789]
AnomalyNCDは、既存の異常検出手法と互換性のある多クラス異常分類フレームワークである。
異常特有の特徴を学習し、自己管理的な方法で異常を分類する。
本手法は,MVTec ADおよびMTDデータセットの最先端処理よりも優れる。
論文 参考訳(メタデータ) (2024-10-18T11:07:12Z) - Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - LADMIM: Logical Anomaly Detection with Masked Image Modeling in Discrete Latent Space [0.0]
マスク付き画像モデリングは、画像中のマスキング領域の特徴表現を予測する自己教師付き学習技術である。
本稿では,MIMの特性を利用して論理異常を効果的に検出する手法を提案する。
提案手法をMVTecLOCOデータセット上で評価し,平均AUC 0.867。
論文 参考訳(メタデータ) (2024-10-14T07:50:56Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - MSFlow: Multi-Scale Flow-based Framework for Unsupervised Anomaly
Detection [124.52227588930543]
教師なし異常検出(UAD)は多くの研究の関心を集め、幅広い応用を推進している。
不明瞭だが強力な統計モデルである正規化フローは、教師なしの方法で異常検出と局所化に適している。
非対称な並列フローと融合フローからなるMSFlowと呼ばれる新しいマルチスケールフローベースフレームワークを提案する。
我々のMSFlowは、検出AUORCスコアが99.7%、ローカライゼーションAUCROCスコアが98.8%、プロスコアが97.1%の新たな最先端技術を実現している。
論文 参考訳(メタデータ) (2023-08-29T13:38:35Z) - Deep Learning based Defect classification and detection in SEM images: A
Mask R-CNN approach [2.7180863515048674]
我々は,コンピュータビジョンのためのディープラーニングアルゴリズムであるMask-RCNN(Regional Convolutional Neural Network)の応用を実証した。
我々は,ブリッジ,ブレーク,ライン崩壊など,クラス間のさまざまな欠陥パターンを検出し,セグメンテーションすることを目的としている。
論文 参考訳(メタデータ) (2022-11-03T23:26:40Z) - Self-Supervised Predictive Convolutional Attentive Block for Anomaly
Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。
我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。
画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文 参考訳(メタデータ) (2021-11-17T13:30:31Z) - Modeling the Distribution of Normal Data in Pre-Trained Deep Features
for Anomaly Detection [2.9864637081333085]
画像中の異常検出(AD)は、標準からかなり逸脱した画像や画像のサブ構造を特定することを指す。
本研究では,大きな自然画像データセット上での識別モデルにより学習された深い特徴表現が,正規性を記述するのに適していることを示す。
論文 参考訳(メタデータ) (2020-05-28T16:43:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。