論文の概要: Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach
- arxiv url: http://arxiv.org/abs/2311.16514v2
- Date: Sun, 7 Apr 2024 13:33:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 02:06:00.429563
- Title: Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach
- Title(参考訳): 時空間擬似異常生成によるビデオ異常検出 : 統一的アプローチ
- Authors: Ayush K. Rai, Tarun Krishna, Feiyan Hu, Alexandru Drimbarean, Kevin McGuinness, Alan F. Smeaton, Noel E. O'Connor,
- Abstract要約: 本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
- 参考スコア(独自算出の注目度): 49.995833831087175
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video Anomaly Detection (VAD) is an open-set recognition task, which is usually formulated as a one-class classification (OCC) problem, where training data is comprised of videos with normal instances while test data contains both normal and anomalous instances. Recent works have investigated the creation of pseudo-anomalies (PAs) using only the normal data and making strong assumptions about real-world anomalies with regards to abnormality of objects and speed of motion to inject prior information about anomalies in an autoencoder (AE) based reconstruction model during training. This work proposes a novel method for generating generic spatio-temporal PAs by inpainting a masked out region of an image using a pre-trained Latent Diffusion Model and further perturbing the optical flow using mixup to emulate spatio-temporal distortions in the data. In addition, we present a simple unified framework to detect real-world anomalies under the OCC setting by learning three types of anomaly indicators, namely reconstruction quality, temporal irregularity and semantic inconsistency. Extensive experiments on four VAD benchmark datasets namely Ped2, Avenue, ShanghaiTech and UBnormal demonstrate that our method performs on par with other existing state-of-the-art PAs generation and reconstruction based methods under the OCC setting. Our analysis also examines the transferability and generalisation of PAs across these datasets, offering valuable insights by identifying real-world anomalies through PAs.
- Abstract(参考訳): ビデオ異常検出(英語: Video Anomaly Detection, VAD)は、通常、一級分類(OCC)問題として定式化されるオープンセットの認識タスクである。
近年の研究では,物体の異常や動作速度に関して,通常のデータのみを用いて擬似異常 (PA) を作成することや,訓練中の自己エンコーダ (AE) を用いた再構成モデルにおいて,異常に関する事前情報を注入するための実世界の異常を強く仮定する研究が行われている。
本研究では、事前学習した潜時拡散モデルを用いて画像のマスクアウト領域を塗布し、ミックスアップを用いて光流を摂動させ、データ中の時空間歪みをエミュレートすることで、時空間PAを生成する新しい手法を提案する。
さらに,OCC設定下における実世界の異常を検出するための簡易な統合フレームワークを提案する。
Ped2, Avenue, ShanghaiTech, UBnormalの4つのVADベンチマークデータセットに対する大規模な実験により, 提案手法はOCC設定下での既存のPAs生成および再構築手法と同等に動作することを示した。
分析では,これらのデータセット間でのPAの転送可能性や一般化についても検討し,PAを通して現実世界の異常を識別することによって,貴重な洞察を提供する。
関連論文リスト
- Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Time-series Anomaly Detection via Contextual Discriminative Contrastive
Learning [0.0]
一級分類法は、異常検出タスクに一般的に使用される。
本稿では,DeepSVDDの損失関数に着想を得た新しい手法を提案する。
我々は,我々のアプローチと,将来有望な自己教師型学習異常検出手法であるNeutral ADによる決定論的コントラスト損失を組み合わせた。
論文 参考訳(メタデータ) (2023-04-16T21:36:19Z) - PseudoBound: Limiting the anomaly reconstruction capability of one-class
classifiers using pseudo anomalies [13.14903445595385]
オートエンコーダ(AE)は、正常な訓練データのみを再構成するために訓練され、テスト時間内に異常なデータを貧弱に再構築する。
本稿では,AEのトレーニング中に擬似異常を組み込むことにより,AEの異常再構築能力を制限することを提案する。
3つのベンチマークビデオ異常データセット上で,既存のSOTA手法に対する擬似異常に基づくトレーニング手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-03-19T16:19:13Z) - Unsupervised Visual Defect Detection with Score-Based Generative Model [17.610722842950555]
我々は、教師なしの視覚的欠陥検出とローカライゼーションタスクに焦点をあてる。
近年のスコアベース生成モデルに基づく新しいフレームワークを提案する。
提案手法を複数のデータセット上で評価し,その有効性を実証する。
論文 参考訳(メタデータ) (2022-11-29T11:06:29Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Object-centric and memory-guided normality reconstruction for video
anomaly detection [56.64792194894702]
本稿では,ビデオ監視における異常検出問題に対処する。
異常事象の固有な規則性と不均一性のため、問題は正規性モデリング戦略と見なされる。
我々のモデルは、トレーニング中に異常なサンプルを見ることなく、オブジェクト中心の正規パターンを学習する。
論文 参考訳(メタデータ) (2022-03-07T19:28:39Z) - Self-Supervised Predictive Convolutional Attentive Block for Anomaly
Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。
我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。
画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文 参考訳(メタデータ) (2021-11-17T13:30:31Z) - Learning Not to Reconstruct Anomalies [14.632592282260363]
オートエンコーダ(AE)は、通常のデータのみからなるトレーニングセットで入力を再構築するために訓練される。
AEは、異常なデータを十分に再構築しつつ、正常なデータを適切に再構築することが期待されている。
本稿では,入力によらず,通常のデータのみを再構築する目的で,AEを訓練するための新しい手法を提案する。
論文 参考訳(メタデータ) (2021-10-19T05:22:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。