論文の概要: View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis
- arxiv url: http://arxiv.org/abs/2406.18012v2
- Date: Tue, 01 Apr 2025 00:59:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-02 20:27:04.249093
- Title: View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis
- Title(参考訳): 適応的なビュー合成を用いた多目的シーンにおけるビュー不変の画素異常検出
- Authors: Subin Varghese, Vedhus Hoskere,
- Abstract要約: 異常検出アプローチは一般的に教師なしであり、期待状態から逸脱を検出することで機能する。
本稿では,2つの画像から異常を検出するScene Anomaly Detection (Scene AD)の問題を紹介する。
逆蒸留異常検出法を改良し,Scene ADに取り組む新しいネットワークOmniADを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual anomaly detection in the built environment is a valuable tool for applications such as infrastructure assessment, construction monitoring, security surveillance, and urban planning. Anomaly detection approaches are typically unsupervised and work by detecting deviations from an expected state where no assumptions are made exact type of deviation. Unsupervised pixel-level anomaly detection methods have been developed to successfully recognize and segment anomalies; however, existing techniques are designed for industrial settings with a fixed camera position. In the built environment, images are periodically captured by a camera operated manually or mounted on aerial or ground vehicles. The camera pose between successive collections may vary widely voiding a fundamental assumption in existing anomaly detection approaches. To address this gap, we introduce the problem of Scene Anomaly Detection (Scene AD), where the goal is to detect anomalies from two sets of images: one set without anomalies and one set that may or may not contain anomalies. No labeled semantic segmentation data are provided for training. We propose a novel network, OmniAD, to tackle Scene AD by refining the reverse distillation anomaly detection method, leading to a 40\% improvement in pixel-level anomaly detection. Additionally, we introduce two new data augmentation strategies that leverage novel view synthesis and camera localization to enhance generalization. We evaluate our approach both qualitatively and quantitatively on a new dataset, ToyCity the first Scene AD dataset featuring multiple objects as well as on the established single object centric dataset, MAD. Our method demonstrates marked improvement over baseline approaches, paving the way for robust anomaly detection in scenes with real-world camera pose variations commonly observed in the built environment. https://drags99.github.io/OmniAD/
- Abstract(参考訳): 構築された環境における視覚異常検出は、インフラアセスメント、建設監視、セキュリティ監視、都市計画といったアプリケーションにとって貴重なツールである。
異常検出アプローチは一般に教師なしであり、想定された状態からの偏差を検出することで機能する。
教師なし画素レベルの異常検出手法が開発され,異常の認識とセグメント化に成功しているが,既存の技術は固定カメラ位置の工業的設定のために設計されている。
構築された環境では、画像は定期的に手動で操作されるカメラによって撮影されるか、空中または地上の車両に搭載される。
連続するコレクション間のカメラのポーズは、既存の異常検出アプローチの基本的な仮定を無効にする可能性がある。
このギャップに対処するために,画像の2つのセットから異常を検知するScene Anomaly Detection (Scene AD) の問題を導入する。
トレーニング用にラベル付きセマンティックセグメンテーションデータは提供されない。
本稿では, 逆蒸留異常検出法を改良し, 画素レベルの異常検出を40%向上させることにより, Scene ADに取り組む新しいネットワークOmniADを提案する。
さらに、新しいビュー合成とカメラのローカライゼーションを活用して一般化を促進する2つの新しいデータ拡張戦略を導入する。
我々は、新しいデータセット、ToyCity、複数のオブジェクトを含む最初のScene ADデータセット、確立された単一オブジェクト中心のデータセットMADにおいて、我々のアプローチを質的かつ定量的に評価する。
提案手法はベースラインアプローチよりも顕著な改善を示し,構築環境下でよく見られる実写カメラの撮影シーンにおけるロバストな異常検出の道を開く。
https://drags99.github.io/OmniAD/
関連論文リスト
- Track Any Anomalous Object: A Granular Video Anomaly Detection Pipeline [63.96226274616927]
Track Any Anomalous Object (TAO)と呼ばれる新しいフレームワークでは、詳細なビデオ異常検出パイプラインが導入されている。
各画素に異常スコアを割り当てる手法とは異なり、我々の手法は問題から異常オブジェクトの画素レベルの追跡に変換する。
実験の結果、TAOは新しいベンチマークを精度と堅牢性で設定した。
論文 参考訳(メタデータ) (2025-06-05T15:49:39Z) - Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach [69.01456182499486]
textbfBR-Genは、さまざまなシーン認識アノテーションを備えた15万のローカル鍛造イメージの大規模なデータセットである。
textbfNFA-ViTはノイズ誘導フォージェリ増幅ビジョン変換器で、ローカライズされたフォージェリの検出を強化する。
論文 参考訳(メタデータ) (2025-04-16T09:57:23Z) - Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。
本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。
提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - A Dataset for Semantic Segmentation in the Presence of Unknowns [49.795683850385956]
既存のデータセットは、既知のものや未知のもののみの評価を可能にするが、両方ではない。
乱雑な実環境からの多様な異常な入力を特徴とする,新しい異常セグメンテーションデータセットISSUを提案する。
データセットは、既存の異常セグメンテーションデータセットの2倍大きい。
論文 参考訳(メタデータ) (2025-03-28T10:31:01Z) - BOOTPLACE: Bootstrapped Object Placement with Detection Transformers [23.300369070771836]
本稿では,オブジェクト配置を位置検出問題として定式化する新しいパラダイムであるBOOTPLACEを紹介する。
確立されたベンチマークの実験結果は、BOOTPLACEのオブジェクト再配置における優れた性能を示している。
論文 参考訳(メタデータ) (2025-03-27T21:21:20Z) - AnomalyCD: A benchmark for Earth anomaly change detection with high-resolution and time-series observations [12.35831157851407]
AnomalyCD技術は、過去の正常な変化パターンから学習することで、異常な変化を特定することを学ぶ。
AnomalyCDMは効率を高めるための2段階のワークフローとして設計されており、見えない画像を直接処理することができる。
論文 参考訳(メタデータ) (2024-09-09T14:47:57Z) - UMAD: University of Macau Anomaly Detection Benchmark Dataset [26.25955201927986]
本稿では,ロボットパトロールシナリオにおける参照による異常検出のための最初のベンチマークデータセットを紹介する。
提案するベンチマークデータセットは,ロボットの正確な位置推定に基づいて,各クエリ画像が対応する参照を見つけることができるよう精査されている。
提案するベンチマークデータセットに加えて,このデータセットに基づいてADrのベースラインモデルを評価する。
論文 参考訳(メタデータ) (2024-08-22T16:32:19Z) - Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-12T03:31:29Z) - Towards Open-World Object-based Anomaly Detection via Self-Supervised Outlier Synthesis [15.748043194987075]
この研究は、オープンワールドオブジェクト検出器とOoD検出器を仮想外周で活用することでギャップを埋めることを目的としている。
提案手法では,オブジェクト検出アーキテクチャ全体を拡張して,クラスラベルに依存することなく,異常に認識された特徴表現を学習する。
提案手法は,オブジェクトレベルの異常検出における最先端性能を確立し,自然画像の平均リコールスコアを5.4%以上向上させる。
論文 参考訳(メタデータ) (2024-07-22T16:16:38Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - ATAC-Net: Zoomed view works better for Anomaly Detection [1.024113475677323]
ATAC-Netは、既知の最小限の事前異常から異常を検出する訓練を行うフレームワークである。
我々は、その優位性を、同等の設定で現在の最先端技術と比較する。
論文 参考訳(メタデータ) (2024-06-20T15:18:32Z) - RAD: A Comprehensive Dataset for Benchmarking the Robustness of Image Anomaly Detection [4.231702796492545]
本研究では,自由なビュー,不均一な照度,ぼやけたコレクションを備えたロバスト異常検出データセットを提案する。
RADは、ワーキングプラットフォーム上の異物を異常として識別することを目的としている。
RADを用いた非教師ありゼロショット法11点の評価と解析を行った。
論文 参考訳(メタデータ) (2024-06-11T11:39:44Z) - Anomaly Detection by Context Contrasting [57.695202846009714]
異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。
近年の自己教師型学習の進歩は、この点において大きな可能性を秘めている。
我々はコンテキスト拡張を通じて学習するCon$を提案する。
論文 参考訳(メタデータ) (2024-05-29T07:59:06Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - That's BAD: Blind Anomaly Detection by Implicit Local Feature Clustering [28.296651124677556]
ブラインド異常検出(BAD)の設定は、局所的な異常検出問題に変換することができる。
画像および画素レベルの異常を正確に検出できるPatchClusterという新しい手法を提案する。
実験結果から、PatchClusterは通常のデータを知ることなく、有望なパフォーマンスを示すことがわかった。
論文 参考訳(メタデータ) (2023-07-06T18:17:43Z) - Unsupervised Visual Defect Detection with Score-Based Generative Model [17.610722842950555]
我々は、教師なしの視覚的欠陥検出とローカライゼーションタスクに焦点をあてる。
近年のスコアベース生成モデルに基づく新しいフレームワークを提案する。
提案手法を複数のデータセット上で評価し,その有効性を実証する。
論文 参考訳(メタデータ) (2022-11-29T11:06:29Z) - Self-Calibrating Anomaly and Change Detection for Autonomous Inspection
Robots [0.07366405857677225]
視覚異常または変化検出アルゴリズムは、参照画像やデータセットとは異なる画像の領域を特定する。
本研究では,事前の未知環境における異常や変化を検出するための総合的なディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-26T09:52:12Z) - Self-Supervised Predictive Convolutional Attentive Block for Anomaly
Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。
我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。
画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文 参考訳(メタデータ) (2021-11-17T13:30:31Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - Unsupervised Two-Stage Anomaly Detection [18.045265572566276]
単一の画像からの異常検出は、異常データが常に稀で、予測不能な型を持つ可能性があるため、難しい。
本研究では,高忠実かつ異常のない再構成を生成する2段階アプローチを提案する。
提案手法は,4つの異常検出データセットの最先端性能を上回っている。
論文 参考訳(メタデータ) (2021-03-22T08:57:27Z) - A Background-Agnostic Framework with Adversarial Training for Abnormal
Event Detection in Video [120.18562044084678]
近年,ビデオにおける異常事象検出は複雑なコンピュータビジョンの問題として注目されている。
通常のイベントのみを含むトレーニングビデオから学習するバックグラウンドに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-27T18:39:24Z) - OIAD: One-for-all Image Anomaly Detection with Disentanglement Learning [23.48763375455514]
クリーンサンプルのみを用いたアンタングル学習に基づく一対一画像異常検出システムを提案する。
3つのデータセットを用いて実験したところ、OIADは90%以上の異常を検出できる一方で、誤報率も低く抑えられることがわかった。
論文 参考訳(メタデータ) (2020-01-18T09:57:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。