論文の概要: When Anomalies Depend on Context: Learning Conditional Compatibility for Anomaly Detection
- arxiv url: http://arxiv.org/abs/2601.22868v1
- Date: Fri, 30 Jan 2026 11:48:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.413657
- Title: When Anomalies Depend on Context: Learning Conditional Compatibility for Anomaly Detection
- Title(参考訳): 異常が文脈に依存するとき:異常検出のための条件適合性を学ぶ
- Authors: Shashank Mishra, Didier Stricker, Jason Rambach,
- Abstract要約: 異常検出はしばしば、異常が観測の本質的な性質であり、文脈に依存しないという仮定の下で定式化される。
この仮定は、同じオブジェクトやアクションが正常である場合や、遅延したコンテキスト要因によって異常な場合など、現実世界の多くの設定で分解される。
従来,文脈に依存した異常として定義され,視覚領域で機能的に機能するアンフコンテクスチュアルな異常検出法について検討した。
- 参考スコア(独自算出の注目度): 15.88746061477275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomaly detection is often formulated under the assumption that abnormality is an intrinsic property of an observation, independent of context. This assumption breaks down in many real-world settings, where the same object or action may be normal or anomalous depending on latent contextual factors (e.g., running on a track versus on a highway). We revisit \emph{contextual anomaly detection}, classically defined as context-dependent abnormality, and operationalize it in the visual domain, where anomaly labels depend on subject--context compatibility rather than intrinsic appearance. To enable systematic study of this setting, we introduce CAAD-3K, a benchmark that isolates contextual anomalies by controlling subject identity while varying context. We further propose a conditional compatibility learning framework that leverages vision--language representations to model subject--context relationships under limited supervision. Our method substantially outperforms existing approaches on CAAD-3K and achieves state-of-the-art performance on MVTec-AD and VisA, demonstrating that modeling context dependence complements traditional structural anomaly detection. Our code and dataset will be publicly released.
- Abstract(参考訳): 異常検出はしばしば、異常が観測の本質的な性質であり、文脈に依存しないという仮定の下で定式化される。
この仮定は、同じオブジェクトやアクションが、遅延したコンテキスト要因(例えば、トラック上で走る場合と高速道路上で走る場合)によって、通常または異常になるような、現実世界の多くの設定で分解される。
従来の文脈依存的異常として定義されていた「emph{contextual anomaly detection}」を再検討し、視覚領域で運用する。
この設定を体系的に研究するためのベンチマークCAAD-3Kを導入する。
さらに,限られた監督下での主語関係のモデル化に視覚言語表現を活用する条件整合学習フレームワークを提案する。
提案手法は,CAAD-3Kの既存手法よりも大幅に優れ,MVTec-ADとVisAの最先端性能を実現し,従来の構造異常検出を補完する手法であることを示す。
コードとデータセットは公開されます。
関連論文リスト
- SetAD: Semi-Supervised Anomaly Learning in Contextual Sets [25.628827917857603]
半教師付き異常検出は、限られたラベル付きデータを効果的に活用することで大きな可能性を秘めている。
本研究では,半教師付きADをSet-level Anomaly Detectionタスクとして再編成する新しいフレームワークであるSetADを提案する。
頑健性とスコアの校正性を高めるため,文脈校正型異常スコアリング機構を提案する。
論文 参考訳(メタデータ) (2025-11-26T13:27:59Z) - Vision Foundation Model Embedding-Based Semantic Anomaly Detection [12.940376547110509]
この研究は、最先端のビジョン基盤モデルのセマンティックな先行性を活用することによって、意味的異常の検出を探索する。
本稿では,ランタイム画像からの局所的な視覚埋め込みと,自律システムの安全性と性能を考慮に入れた,名目上のシナリオのデータベースを比較するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-12T19:00:29Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Updated version: A Video Anomaly Detection Framework based on
Appearance-Motion Semantics Representation Consistency [2.395616571632115]
本稿では,出現動作のセマンティックス一貫性表現の枠組みを提案する。
この2ストリーム構造は、通常のサンプルの外観および動き情報表現を符号化するように設計されている。
特徴セマンティクスの整合性を高めるために、一貫性の低い異常を識別できるように、新しい整合性損失を提案する。
論文 参考訳(メタデータ) (2023-03-09T08:28:34Z) - Context-Dependent Anomaly Detection with Knowledge Graph Embedding
Models [0.0]
本研究では,コンテキスト依存型異常検出問題をリンク予測問題に変換するフレームワークを開発する。
本研究では,文脈依存型異常を高い精度で検出できることを示す。
論文 参考訳(メタデータ) (2022-03-17T14:36:12Z) - Exploiting Multi-Object Relationships for Detecting Adversarial Attacks
in Complex Scenes [51.65308857232767]
ディープニューラルネットワーク(DNN)をデプロイするビジョンシステムは、敵の例に弱いことが知られている。
近年の研究では、入力データの固有成分のチェックは、敵攻撃を検出するための有望な方法であることが示された。
言語モデルを用いてコンテキスト整合性チェックを行う新しい手法を開発した。
論文 参考訳(メタデータ) (2021-08-19T00:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。