論文の概要: ABounD: Adversarial Boundary-Driven Few-Shot Learning for Multi-Class Anomaly Detection
- arxiv url: http://arxiv.org/abs/2511.22436v1
- Date: Thu, 27 Nov 2025 13:18:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.577218
- Title: ABounD: Adversarial Boundary-Driven Few-Shot Learning for Multi-Class Anomaly Detection
- Title(参考訳): ABounD:マルチクラス異常検出のための逆境界駆動Few-Shot学習
- Authors: Runzhi Deng, Yundi Hu, Xinshuang Zhang, Zhao Wang, Xixi Liu, Wang-Zhou Dai, Caifeng Shan, Fang Zhao,
- Abstract要約: ABversaounDは、マルチクラス異常検出のためのAdrial Boundary-Driven few-shot Learningフレームワークである。
意味論的概念学習と意思決定境界形成を統合している。
MVTec-ADとVisAデータセットの実験は、最先端のパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 24.691181948844136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot multi-class industrial anomaly detection remains a challenging task. Vision-language models need to be both category-adaptive and sharply discriminative, yet data scarcity often blurs the boundary between normal and abnormal states. This ambiguity leads to missed subtle defects and the rejection of atypical normal samples. We propose ABounD, an Adversarial Boundary-Driven few-shot learning for multi-class anomaly detection, which is a unified learning framework that integrates semantic concept learning with decision boundary shaping. The Dynamic Concept Fusion (DCF) module produces class-adaptive prompts by fusing generalizable priors with class-specific cues, conditioned on image features. Meanwhile, Adversarial Boundary Forging (ABF) sculpts a more precise decision margin by generating boundary-level fence features via PGD-style perturbations. Training is conducted in a single stage under a Concept-Boundary Loss, where ABF provides the main supervisory signal and semantic-spatial regularizers stabilize the optimization. This synergy yields a decision boundary that closely follows normal data while preserving flexibility and robust semantic alignment. Experiments on MVTec-AD and VisA datasets demonstrate state-of-the-art performance in the task of few-shot multi-class anomaly detection.
- Abstract(参考訳): 数発のマルチクラス産業異常検出は依然として難しい課題である。
視覚言語モデルは、カテゴリー適応と鋭い識別の両方を必要とするが、データ不足は、通常状態と異常状態の境界を曖昧にすることが多い。
この曖昧さは、微妙な欠陥と非定型正規サンプルの拒絶につながる。
本稿では,意味論的概念学習と意思決定境界形成を統合した統合学習フレームワークであるABounDを提案する。
Dynamic Concept Fusion (DCF)モジュールは、画像の特徴に基づいて、クラス固有のキューで一般化可能なプリミティブを融合することで、クラス適応プロンプトを生成する。
一方、Adversarial boundary Forging (ABF)は、PGDスタイルの摂動によって境界レベルのフェンス特徴を生成することにより、より正確な決定マージンを彫刻する。
ABFは主要な監視信号を提供し、意味空間正規化器は最適化を安定化する。
このシナジーは、柔軟性と堅牢なセマンティックアライメントを維持しながら、通常のデータに密接に従う決定境界をもたらす。
MVTec-ADとVisAデータセットの実験は、数発のマルチクラス異常検出タスクにおける最先端のパフォーマンスを示す。
関連論文リスト
- Learning to Tell Apart: Weakly Supervised Video Anomaly Detection via Disentangled Semantic Alignment [47.507511439028754]
本稿では,不規則な特徴と正常な特徴を粗粒度と細粒度から明確に分離する,DSANet(Disentangled Semantic Alignment Network)を提案する。
粗粒度レベルでは,学習された正規プロトタイプの指導のもと,入力映像の特徴を再構成する自己誘導正規性モデリングブランチを導入する。
詳細なレベルでは、まず、各動画をイベント中心およびバックグラウンド中心のコンポーネントに分解する、分離されたコントラスト的セマンティックアライメント機構を示す。
論文 参考訳(メタデータ) (2025-11-13T14:06:48Z) - Unified Unsupervised Anomaly Detection via Matching Cost Filtering [113.43366521994396]
教師なし異常検出(UAD)は、通常のトレーニングデータのみを用いて画像レベルの異常と画素レベルの異常を識別することを目的としている。
UADモデルの異常コスト量を補正するための汎用的なポストホック精錬フレームワークであるUnified Cost Filtering (UCF) を提案する。
論文 参考訳(メタデータ) (2025-10-03T03:28:18Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [109.72772150095646]
FAPromptは、精密なZSADのためのきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
産業的欠陥と医療的異常の両方をカバーする19の実世界のデータセットの実験は、FAPromptが画像レベルのZSADタスクとピクセルレベルのZSADタスクの両方で最先端の手法を大幅に上回っていることを実証している。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - Vision-Language Models Assisted Unsupervised Video Anomaly Detection [3.1095294567873606]
異常サンプルは教師なし学習手法における重要な課題を示す。
提案手法では,大規模言語モデルの推論能力を活用したモーダル事前学習モデルを用いる。
本手法は,高次元視覚特徴を低次元意味的特徴にマッピングすることにより,教師なし異常検出の解釈可能性を大幅に向上させる。
論文 参考訳(メタデータ) (2024-09-21T11:48:54Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Learning Prompt-Enhanced Context Features for Weakly-Supervised Video
Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。
本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。
提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文 参考訳(メタデータ) (2023-06-26T06:45:16Z) - Harnessing Contrastive Learning and Neural Transformation for Time Series Anomaly Detection [0.0]
時系列異常検出(TSAD)は多くの産業応用において重要な役割を担っている。
コントラスト学習は、ラベルのないデータから意味のある表現を抽出する過程において、時系列領域で勢いを増している。
本研究では,学習可能な変換で強化されたウィンドウベースのコントラスト学習戦略を取り入れた新しいアプローチであるCNTを提案する。
論文 参考訳(メタデータ) (2023-04-16T21:36:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。