論文の概要: View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis
- arxiv url: http://arxiv.org/abs/2406.18012v3
- Date: Mon, 19 May 2025 18:23:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:51.144038
- Title: View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis
- Title(参考訳): 適応的なビュー合成を用いた多目的シーンにおけるビュー不変の画素異常検出
- Authors: Subin Varghese, Vedhus Hoskere,
- Abstract要約: 我々は、教師なし、画素ワイドな異常位置検出のタスクとして、シーン異常検出(Scene Anomaly Detection, Scene AD)を導入し、フォーマル化する。
ToyCityは,最初のマルチオブジェクト・マルチビューリアルタイム画像データセットである。
実験の結果,OmniADは拡張ビューで使用すると,逆蒸留よりも64.33%の画素幅(F_1)のスコアが増大することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The built environment, encompassing critical infrastructure such as bridges and buildings, requires diligent monitoring of unexpected anomalies or deviations from a normal state in captured imagery. Anomaly detection methods could aid in automating this task; however, deploying anomaly detection effectively in such environments presents significant challenges that have not been evaluated before. These challenges include camera viewpoints that vary, the presence of multiple objects within a scene, and the absence of labeled anomaly data for training. To address these comprehensively, we introduce and formalize Scene Anomaly Detection (Scene AD) as the task of unsupervised, pixel-wise anomaly localization under these specific real-world conditions. Evaluating progress in Scene AD required the development of ToyCity, the first multi-object, multi-view real-image dataset, for unsupervised anomaly detection. Our initial evaluations using ToyCity revealed that established anomaly detection baselines struggle to achieve robust pixel-level localization. To address this, two data augmentation strategies were created to generate additional synthetic images of non-anomalous regions to enhance generalizability. However, the addition of these synthetic images alone only provided minor improvements. Thus, OmniAD, a refinement of the Reverse Distillation methodology, was created to establish a stronger baseline. Our experiments demonstrate that OmniAD, when used with augmented views, yields a 64.33\% increase in pixel-wise \(F_1\) score over Reverse Distillation with no augmentation. Collectively, this work offers the Scene AD task definition, the ToyCity benchmark, the view synthesis augmentation approaches, and the OmniAD method. Project Page: https://drags99.github.io/OmniAD/
- Abstract(参考訳): 橋や建物などの重要なインフラを含む構築された環境は、撮像された画像の通常の状態からの予期せぬ異常や逸脱を厳格に監視する必要がある。
異常検出手法は、このタスクの自動化に役立つが、そのような環境に効果的に異常検出をデプロイすることは、これまで評価されていない重要な課題である。
これらの課題には、異なるカメラ視点、シーン内の複数のオブジェクトの存在、トレーニングのためのラベル付き異常データがないことが含まれる。
これらに包括的に対処するために,実世界の特定の条件下での,教師なし,画素ワイドな局所化のタスクとして,シーン異常検出(Scene Anomaly Detection, Scene AD)を導入し,形式化する。
Scene ADの進歩を評価するには、教師なしの異常検出のための最初のマルチオブジェクト・マルチビューリアルタイムデータセットであるToyCityの開発が必要だった。
ToyCity を用いた初期評価の結果,確立された異常検出ベースラインは,画素レベルのロバストなローカライゼーションの実現に苦慮していることが明らかとなった。
これを解決するために、2つのデータ拡張戦略が作成され、非アノマラス領域の合成画像が生成され、一般化性が向上した。
しかし、これらの合成画像の追加だけではわずかな改善しか得られなかった。
したがって、逆蒸留法の改良であるOmniADは、より強力なベースラインを確立するために作られた。
実験の結果,OmniADは拡張ビューで使用すると,逆蒸留よりも64.33倍のピクセル長が増加することがわかった。
まとめると、この作業はScene ADタスク定義、ToyCityベンチマーク、ビュー合成拡張アプローチ、OmniADメソッドを提供する。
Project Page: https://drags99.github.io/OmniAD/
関連論文リスト
- Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。
本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。
提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - A Dataset for Semantic Segmentation in the Presence of Unknowns [49.795683850385956]
既存のデータセットは、既知のものや未知のもののみの評価を可能にするが、両方ではない。
乱雑な実環境からの多様な異常な入力を特徴とする,新しい異常セグメンテーションデータセットISSUを提案する。
データセットは、既存の異常セグメンテーションデータセットの2倍大きい。
論文 参考訳(メタデータ) (2025-03-28T10:31:01Z) - UMAD: University of Macau Anomaly Detection Benchmark Dataset [26.25955201927986]
本稿では,ロボットパトロールシナリオにおける参照による異常検出のための最初のベンチマークデータセットを紹介する。
提案するベンチマークデータセットは,ロボットの正確な位置推定に基づいて,各クエリ画像が対応する参照を見つけることができるよう精査されている。
提案するベンチマークデータセットに加えて,このデータセットに基づいてADrのベースラインモデルを評価する。
論文 参考訳(メタデータ) (2024-08-22T16:32:19Z) - Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-12T03:31:29Z) - Towards Open-World Object-based Anomaly Detection via Self-Supervised Outlier Synthesis [15.748043194987075]
この研究は、オープンワールドオブジェクト検出器とOoD検出器を仮想外周で活用することでギャップを埋めることを目的としている。
提案手法では,オブジェクト検出アーキテクチャ全体を拡張して,クラスラベルに依存することなく,異常に認識された特徴表現を学習する。
提案手法は,オブジェクトレベルの異常検出における最先端性能を確立し,自然画像の平均リコールスコアを5.4%以上向上させる。
論文 参考訳(メタデータ) (2024-07-22T16:16:38Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - ATAC-Net: Zoomed view works better for Anomaly Detection [1.024113475677323]
ATAC-Netは、既知の最小限の事前異常から異常を検出する訓練を行うフレームワークである。
我々は、その優位性を、同等の設定で現在の最先端技術と比較する。
論文 参考訳(メタデータ) (2024-06-20T15:18:32Z) - RAD: A Comprehensive Dataset for Benchmarking the Robustness of Image Anomaly Detection [4.231702796492545]
本研究では,自由なビュー,不均一な照度,ぼやけたコレクションを備えたロバスト異常検出データセットを提案する。
RADは、ワーキングプラットフォーム上の異物を異常として識別することを目的としている。
RADを用いた非教師ありゼロショット法11点の評価と解析を行った。
論文 参考訳(メタデータ) (2024-06-11T11:39:44Z) - Anomaly Detection by Context Contrasting [57.695202846009714]
異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。
近年の自己教師型学習の進歩は、この点において大きな可能性を秘めている。
我々はコンテキスト拡張を通じて学習するCon$を提案する。
論文 参考訳(メタデータ) (2024-05-29T07:59:06Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - That's BAD: Blind Anomaly Detection by Implicit Local Feature Clustering [28.296651124677556]
ブラインド異常検出(BAD)の設定は、局所的な異常検出問題に変換することができる。
画像および画素レベルの異常を正確に検出できるPatchClusterという新しい手法を提案する。
実験結果から、PatchClusterは通常のデータを知ることなく、有望なパフォーマンスを示すことがわかった。
論文 参考訳(メタデータ) (2023-07-06T18:17:43Z) - Self-Calibrating Anomaly and Change Detection for Autonomous Inspection
Robots [0.07366405857677225]
視覚異常または変化検出アルゴリズムは、参照画像やデータセットとは異なる画像の領域を特定する。
本研究では,事前の未知環境における異常や変化を検出するための総合的なディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-26T09:52:12Z) - Self-Supervised Predictive Convolutional Attentive Block for Anomaly
Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。
我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。
画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文 参考訳(メタデータ) (2021-11-17T13:30:31Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - A Background-Agnostic Framework with Adversarial Training for Abnormal
Event Detection in Video [120.18562044084678]
近年,ビデオにおける異常事象検出は複雑なコンピュータビジョンの問題として注目されている。
通常のイベントのみを含むトレーニングビデオから学習するバックグラウンドに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-27T18:39:24Z) - OIAD: One-for-all Image Anomaly Detection with Disentanglement Learning [23.48763375455514]
クリーンサンプルのみを用いたアンタングル学習に基づく一対一画像異常検出システムを提案する。
3つのデータセットを用いて実験したところ、OIADは90%以上の異常を検出できる一方で、誤報率も低く抑えられることがわかった。
論文 参考訳(メタデータ) (2020-01-18T09:57:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。