論文の概要: Towards Efficient Pixel Labeling for Industrial Anomaly Detection and Localization
- arxiv url: http://arxiv.org/abs/2509.05034v1
- Date: Fri, 05 Sep 2025 11:45:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.581273
- Title: Towards Efficient Pixel Labeling for Industrial Anomaly Detection and Localization
- Title(参考訳): 工業的異常検出と位置同定のための効率的な画素ラベリングに向けて
- Authors: Jingqi Wu, Hanxi Li, Lin Yuanbo Wu, Hao Chen, Deyin Liu, Peng Wang,
- Abstract要約: 産業用異常検出のためのインタラクティブ画像(IIS)アルゴリズムであるADClickを提案する。
ADClickは、ほんの数回のクリックと短いテキスト記述からピクセル単位の異常アノテーションを生成する。
また、視覚的特徴とテキストプロンプトを整列するクロスモーダルフレームワークであるADClick-Segを紹介します。
- 参考スコア(独自算出の注目度): 12.943900799780293
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Industrial product inspection is often performed using Anomaly Detection (AD) frameworks trained solely on non-defective samples. Although defective samples can be collected during production, leveraging them usually requires pixel-level annotations, limiting scalability. To address this, we propose ADClick, an Interactive Image Segmentation (IIS) algorithm for industrial anomaly detection. ADClick generates pixel-wise anomaly annotations from only a few user clicks and a brief textual description, enabling precise and efficient labeling that significantly improves AD model performance (e.g., AP = 96.1\% on MVTec AD). We further introduce ADClick-Seg, a cross-modal framework that aligns visual features and textual prompts via a prototype-based approach for anomaly detection and localization. By combining pixel-level priors with language-guided cues, ADClick-Seg achieves state-of-the-art results on the challenging ``Multi-class'' AD task (AP = 80.0\%, PRO = 97.5\%, Pixel-AUROC = 99.1\% on MVTec AD).
- Abstract(参考訳): 産業製品検査は、非欠陥サンプルにのみ訓練された異常検出(AD)フレームワークを使用して行われることが多い。
欠陥のあるサンプルは本番環境で収集できるが、それらを活用するには通常はピクセルレベルのアノテーションが必要で、スケーラビリティが制限される。
そこで本研究では,産業用異常検出のための対話型画像分割(IIS)アルゴリズムであるADClickを提案する。
ADClickは、少数のユーザクリックと短いテキスト記述からピクセル単位の異常アノテーションを生成し、ADモデルの性能を大幅に向上させる正確かつ効率的なラベリングを可能にする(例えば、MVTec ADではAP = 96.1\%)。
さらに、ADClick-Segは、視覚的特徴とテキストのプロンプトを、異常検出と局所化のためのプロトタイプベースのアプローチで整列するクロスモーダルフレームワークである。
ADClick-Segは、ピクセルレベルの先行と言語誘導のキューを組み合わせることで、挑戦的な‘Multi-class’ADタスク(AP = 80.0\%, PRO = 97.5\%, Pixel-AUROC = 99.1\% on MVTec AD)で最先端の結果を得る。
関連論文リスト
- Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detection [50.343419243749054]
異常検出は、医学診断や工業的欠陥検出などの分野において重要である。
CLIPの粗粒化画像テキストアライメントは、微粒化異常に対する局所化と検出性能を制限する。
クレーンは最先端のZSADを2%から28%に改善し、画像レベルとピクセルレベルの両方で、推論速度では競争力を維持している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - Towards Efficient Pixel Labeling for Industrial Anomaly Detection and Localization [43.540251113255515]
本稿では,新しいインタラクティブ画像(IIS)アルゴリズムであるADClickを紹介する。
ADClickは、実際の欠陥画像に対して「地中真実」の異常マスクを効率よく生成する。
我々は ADClick の能力を ADClick-Seg に拡張する。
論文 参考訳(メタデータ) (2024-07-03T14:12:43Z) - Test Time Training for Industrial Anomaly Segmentation [15.973768095014906]
産業品質管理にはAD&S(Anomaly Detection and Ranging)が不可欠である。
本稿では,セグメンテーション性能を向上させるためのテストタイムトレーニング戦略を提案する。
我々は,MVTec ADとMVTec 3D-ADの広範囲な実験と評価を通じて,ベースラインに対するアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2024-04-04T18:31:24Z) - AnomalyGPT: Detecting Industrial Anomalies Using Large Vision-Language
Models [30.723122000372538]
AnomalyGPTはLarge Vision-Language Models (LVLM)に基づく新しいIADアプローチである
我々は、異常な画像をシミュレートし、各画像に対応するテキスト記述を生成することで、トレーニングデータを生成する。
AnomalyGPTは86.1%の精度、画像レベルのAUC94.1%、ピクセルレベルのAUC95.3%の精度で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-08-29T15:02:53Z) - Data-Efficient and Interpretable Tabular Anomaly Detection [54.15249463477813]
本稿では,ホワイトボックスモデルクラスである一般化付加モデルを適用し,異常を検出する新しいフレームワークを提案する。
さらに、提案フレームワークであるDIADは、ラベル付きデータの少量を組み込んで、半教師付き設定における異常検出性能をさらに向上させることができる。
論文 参考訳(メタデータ) (2022-03-03T22:02:56Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。