論文の概要: Enhancing Zero-Shot Anomaly Detection: CLIP-SAM Collaboration with Cascaded Prompts
- arxiv url: http://arxiv.org/abs/2510.11028v1
- Date: Mon, 13 Oct 2025 05:53:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.215036
- Title: Enhancing Zero-Shot Anomaly Detection: CLIP-SAM Collaboration with Cascaded Prompts
- Title(参考訳): ゼロショット異常検出の強化:CLIP-SAMとカスケードプロンプとの協調
- Authors: Yanning Hou, Ke Xu, Junfa Li, Yanran Ruan, Jianfeng Qiu,
- Abstract要約: 本稿では,産業用異常検出におけるゼロショット異常セグメンテーションタスクのための新しい2段階フレームワークを提案する。
SAMのオブジェクトセグメンテーションへの傾きを軽減するために,Co-Feature Point Prompt Generationモジュールを提案する。
SAM のセグメンテーション結果をさらに最適化するために,SAM (CPS) モジュール用の Cascaded Prompts を導入する。
- 参考スコア(独自算出の注目度): 5.225009704851243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, the powerful generalization ability exhibited by foundation models has brought forth new solutions for zero-shot anomaly segmentation tasks. However, guiding these foundation models correctly to address downstream tasks remains a challenge. This paper proposes a novel two-stage framework, for zero-shot anomaly segmentation tasks in industrial anomaly detection. This framework excellently leverages the powerful anomaly localization capability of CLIP and the boundary perception ability of SAM.(1) To mitigate SAM's inclination towards object segmentation, we propose the Co-Feature Point Prompt Generation (PPG) module. This module collaboratively utilizes CLIP and SAM to generate positive and negative point prompts, guiding SAM to focus on segmenting anomalous regions rather than the entire object. (2) To further optimize SAM's segmentation results and mitigate rough boundaries and isolated noise, we introduce the Cascaded Prompts for SAM (CPS) module. This module employs hybrid prompts cascaded with a lightweight decoder of SAM, achieving precise segmentation of anomalous regions. Across multiple datasets, consistent experimental validation demonstrates that our approach achieves state-of-the-art zero-shot anomaly segmentation results. Particularly noteworthy is our performance on the Visa dataset, where we outperform the state-of-the-art methods by 10.3\% and 7.7\% in terms of {$F_1$-max} and AP metrics, respectively.
- Abstract(参考訳): 近年,基礎モデルによる強力な一般化能力が,ゼロショット異常分割タスクの新しい解を生み出している。
しかし、下流タスクに対処するためにこれらの基礎モデルを正しく導くことは、依然として課題である。
本稿では,産業用異常検出におけるゼロショット異常セグメンテーションタスクのための新しい2段階フレームワークを提案する。
このフレームワークは、CLIPの強力な異常局所化能力とSAMの境界認識能力を活用している。
1) SAMのオブジェクトセグメンテーションへの傾きを軽減するために, Co-Feature Point Prompt Generation (PPG) モジュールを提案する。
このモジュールはCLIPとSAMを共同で使用し、ポジティブなポイントプロンプトと負のポイントプロンプトを生成し、SAMがオブジェクト全体ではなく、異常領域のセグメンテーションに集中するように誘導する。
2) SAMのセグメンテーション結果をさらに最適化し, 粗い境界と孤立雑音を緩和するために, SAM (CPS) モジュール用のカスケードプロンプツを導入する。
このモジュールはSAMの軽量デコーダを組み込んだハイブリッドプロンプトを使用し、異常領域の正確なセグメンテーションを実現する。
複数のデータセットにまたがって、一貫した実験的な検証により、我々の手法が最先端のゼロショット・セグメンテーション結果を達成することを示す。
特に注目すべきは、VISAデータセットのパフォーマンスです。ここでは、{$F_1$-max} と AP のメトリクスで、最先端のメソッドを 10.3\% と 7.7\% で上回ります。
関連論文リスト
- Segment Concealed Objects with Incomplete Supervision [63.637733655439334]
不完全なスーパービジョン・コンセサイテッド・オブジェクト(ISCOS)は、周囲の環境にシームレスにブレンドするオブジェクトを分割する。
このタスクは、不完全な注釈付きトレーニングデータによって提供される限られた監督のため、非常に難しいままである。
本稿では,これらの課題に対処するためのISCOSの統一手法について紹介する。
論文 参考訳(メタデータ) (2025-06-10T16:25:15Z) - S^4M: Boosting Semi-Supervised Instance Segmentation with SAM [25.94737539065708]
半教師付きインスタンスセグメンテーションは、ラベル付きデータに制限があるため、課題を引き起こす。
現在の教師中心のフレームワークは、信頼性の低い擬似ラベルの品質のため、パフォーマンス上の制約に悩まされている。
論文 参考訳(メタデータ) (2025-04-07T17:59:10Z) - SAQ-SAM: Semantically-Aligned Quantization for Segment Anything Model [9.381558154295012]
本稿では,クリッピング基準として重なり合う注意力を利用した知覚一貫性クリッピングを提案する。
また,マスクデコーダのクロスアテンション応答を活用することで,視覚的プロンプトインタラクションを取り入れたPrompt-Aware Reconstructionを提案する。
本手法は, セグメンテーションタスクにおいて, ベースラインよりも11.7%高いmAPを実現する。
論文 参考訳(メタデータ) (2025-03-09T08:38:32Z) - Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.55145330447408]
異常セグメンテーションのための textbfSelf-textbfPerceptinon textbfTuning (textbfSPT) 法を提案する。
SPT法は, 自己描画型チューニング戦略を取り入れ, 異常マスクの初期粗いドラフトを生成し, 精製処理を行う。
論文 参考訳(メタデータ) (2024-11-26T08:33:25Z) - Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。
UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。
UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文 参考訳(メタデータ) (2024-09-23T19:05:50Z) - ClipSAM: CLIP and SAM Collaboration for Zero-Shot Anomaly Segmentation [5.376142948115328]
本稿では,ZSASのためのCLIPおよびSAM協調フレームワークであるClipSAMを提案する。
ClipSAMの背後にある洞察は、CLIPのセマンティック理解機能を、異常なローカライゼーションと粗いセグメンテーションに活用することである。
本稿では,視覚的特徴と対話するためのUMCI(Unified Multi-scale Cross-modal Interaction)モジュールについて述べる。
論文 参考訳(メタデータ) (2024-01-23T11:20:03Z) - Stable Segment Anything Model [79.9005670886038]
SAM(Segment Anything Model)は、高品質なプロンプトが与えられた場合、顕著に迅速なセグメンテーションを実現する。
本稿では,SAMのセグメンテーション安定性について,多様なプロンプト特性のスペクトルにわたって包括的解析を行った。
1)SAMのセグメンテーション安定性を広範囲に改善し,2)SAMの強力なセグメンテーション効率と一般化を維持した。
論文 参考訳(メタデータ) (2023-11-27T12:51:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。