論文の概要: UniSpector: Towards Universal Open-set Defect Recognition via Spectral-Contrastive Visual Prompting
- arxiv url: http://arxiv.org/abs/2604.02905v1
- Date: Fri, 03 Apr 2026 09:24:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.426226
- Title: UniSpector: Towards Universal Open-set Defect Recognition via Spectral-Contrastive Visual Prompting
- Title(参考訳): UniSpector: スペクトルコントラストビジュアルプロンプティングによるユニバーサルオープンセット欠陥認識を目指して
- Authors: Geonuk Kim, Minhoi Kim, Kangil Lee, Minsu Kim, Hyeonseong Jeon, Jeonghoon Han, Hyoungjoon Lim, Junho Yim,
- Abstract要約: 提案するUniSpectorは,意味的に構造化され,転送可能なプロンプトトポロジの原理設計に焦点を移す。
Inspect Anythingはビジュアルプロンプトベースのオープンセット欠陥ローカライゼーションのための最初のベンチマークであり、UniSpectorは、それぞれAP50bとAP50mで、少なくとも19.7%と15.8%でベースラインを著しく上回っている。
- 参考スコア(独自算出の注目度): 7.971808165863176
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although industrial inspection systems should be capable of recognizing unprecedented defects, most existing approaches operate under a closed-set assumption, which prevents them from detecting novel anomalies. While visual prompting offers a scalable alternative for industrial inspection, existing methods often suffer from prompt embedding collapse due to high intra-class variance and subtle inter-class differences. To resolve this, we propose UniSpector, which shifts the focus from naive prompt-to-region matching to the principled design of a semantically structured and transferable prompt topology. UniSpector employs the Spatial-Spectral Prompt Encoder to extract orientation-invariant, fine-grained representations; these serve as a solid basis for the Contrastive Prompt Encoder to explicitly regularize the prompt space into a semantically organized angular manifold. Additionally, Prompt-guided Query Selection generates adaptive object queries aligned with the prompt. We introduce Inspect Anything, the first benchmark for visual-prompt-based open-set defect localization, where UniSpector significantly outperforms baselines by at least 19.7% and 15.8% in AP50b and AP50m, respectively. These results show that our method enable a scalable, retraining-free inspection paradigm for continuously evolving industrial environments, while offering critical insights into the design of generic visual prompting.
- Abstract(参考訳): 産業検査システムは前例のない欠陥を認識できるべきであるが、既存のほとんどのアプローチはクローズドセットの仮定の下で動作し、新規な異常を検出できない。
視覚的プロンプトは、産業検査にスケーラブルな代替手段を提供するが、既存の手法は、高いクラス内ばらつきと微妙なクラス間の違いにより、しばしば急激な埋め込み崩壊に悩まされる。
この問題を解決するために,UniSpectorを提案する。これは意味的に構造化され,転送可能なプロンプトトポロジの原理設計に焦点を移す。
UniSpectorは、方向不変できめ細かい表現を抽出するためにSpatial-Spectral Prompt Encoderを使用しており、これはContrastive Prompt Encoderの確固たる基盤として機能し、プロンプト空間を意味的に整理された角多様体に明示的に正規化する。
さらに、Prompt-guided Query Selectionは、プロンプトに沿った適応オブジェクトクエリを生成する。
Inspect Anythingはビジュアルプロンプトベースのオープンセット欠陥ローカライゼーションのための最初のベンチマークであり、UniSpectorは、それぞれAP50bとAP50mで、少なくとも19.7%と15.8%でベースラインを著しく上回っている。
これらの結果から,本手法は産業環境を継続的に発展させつつ,汎用的な視覚的プロンプトの設計に関する重要な洞察を提供しながら,スケーラブルで再学習のない検査パラダイムを実現することができることがわかった。
関連論文リスト
- Bayesian Prompt Flow Learning for Zero-Shot Anomaly Detection [17.590853105242864]
視覚言語モデル(例えばCLIP)はゼロショット異常検出(ZSAD)において顕著な性能を示した。
Bayes-PFL は画像固有の分布と画像に依存しない分布の両方を学習するために設計されており、テキストプロンプト空間を正規化し、未知のカテゴリにおけるモデルの一般化を改善するために共同で使用される。
15の産業用および医療用データセットに対する実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2025-03-13T06:05:35Z) - PromptAD: Learning Prompts with only Normal Samples for Few-Shot Anomaly Detection [59.34973469354926]
本稿では,PromptADと呼ばれる,数発の異常検出のための一級プロンプト学習手法を提案する。
画像レベル/ピクセルレベルの異常検出のために、PromptADはMVTecとVisAで11/12のショット設定で1位を達成した。
論文 参考訳(メタデータ) (2024-04-08T06:53:30Z) - Transcending Forgery Specificity with Latent Space Augmentation for Generalizable Deepfake Detection [57.646582245834324]
LSDAと呼ばれる簡易で効果的なディープフェイク検出器を提案する。
より多様な偽の表現は、より一般化可能な決定境界を学べるべきである。
提案手法は驚くほど有効であり, 広く使用されている複数のベンチマークで最先端の検出器を超越することを示す。
論文 参考訳(メタデータ) (2023-11-19T09:41:10Z) - DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.20339155618612]
DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文 参考訳(メタデータ) (2023-03-15T16:14:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。