論文の概要: Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction
- arxiv url: http://arxiv.org/abs/2011.02763v2
- Date: Thu, 27 May 2021 05:53:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 11:41:21.353325
- Title: Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction
- Title(参考訳): マルチパスフレーム予測によるロバスト非教師付きビデオ異常検出
- Authors: Xuanzhao Wang, Zhengping Che, Bo Jiang, Ning Xiao, Ke Yang, Jian Tang,
Jieping Ye, Jingyu Wang, Qi Qi
- Abstract要約: 本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
- 参考スコア(独自算出の注目度): 61.17654438176999
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video anomaly detection is commonly used in many applications such as
security surveillance and is very challenging.A majority of recent video
anomaly detection approaches utilize deep reconstruction models, but their
performance is often suboptimal because of insufficient reconstruction error
differences between normal and abnormal video frames in practice. Meanwhile,
frame prediction-based anomaly detection methods have shown promising
performance. In this paper, we propose a novel and robust unsupervised video
anomaly detection method by frame prediction with proper design which is more
in line with the characteristics of surveillance videos. The proposed method is
equipped with a multi-path ConvGRU-based frame prediction network that can
better handle semantically informative objects and areas of different scales
and capture spatial-temporal dependencies in normal videos. A noise tolerance
loss is introduced during training to mitigate the interference caused by
background noise. Extensive experiments have been conducted on the CUHK Avenue,
ShanghaiTech Campus, and UCSD Pedestrian datasets, and the results show that
our proposed method outperforms existing state-of-the-art approaches.
Remarkably, our proposed method obtains the frame-level AUROC score of 88.3% on
the CUHK Avenue dataset.
- Abstract(参考訳): セキュリティ監視などの多くのアプリケーションでビデオ異常検出が一般的に使われており,近年のビデオ異常検出手法の大部分が深部再構成モデルを使用しているが,実際のビデオフレームと異常フレームの再構成誤差が不十分なため,その性能は低いことが多い。
一方,フレーム予測に基づく異常検出手法は有望な性能を示した。
本稿では,監視ビデオの特徴に則した適切な設計を施したフレーム予測による,新規で堅牢なビデオ異常検出手法を提案する。
提案手法はマルチパスのConvGRUベースのフレーム予測ネットワークを用いて,意味的情報的オブジェクトや異なるスケールの領域をよりよく処理し,通常のビデオにおける空間的依存関係をキャプチャする。
バックグラウンドノイズによる干渉を軽減するために、トレーニング中にノイズ耐性損失を導入する。
CUHK Avenue, ShanghaiTech Campus, UCSD Pedestrian のデータセットに対して大規模な実験を行い, 提案手法が既存の最先端手法よりも優れていることを示す。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROC値を得る。
関連論文リスト
- Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-12T03:31:29Z) - Video Dynamics Prior: An Internal Learning Approach for Robust Video
Enhancements [83.5820690348833]
外部トレーニングデータコーパスを必要としない低レベルの視覚タスクのためのフレームワークを提案する。
提案手法は,コヒーレンス・時間的テストの重み付けと統計内部統計を利用して,破損したシーケンスを最適化することでニューラルモジュールを学習する。
論文 参考訳(メタデータ) (2023-12-13T01:57:11Z) - Dynamic Erasing Network Based on Multi-Scale Temporal Features for
Weakly Supervised Video Anomaly Detection [103.92970668001277]
弱教師付きビデオ異常検出のための動的消去ネットワーク(DE-Net)を提案する。
まず,異なる長さのセグメントから特徴を抽出できるマルチスケール時間モデリングモジュールを提案する。
そして,検出された異常の完全性を動的に評価する動的消去戦略を設計する。
論文 参考訳(メタデータ) (2023-12-04T09:40:11Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Delving into CLIP latent space for Video Anomaly Recognition [24.37974279994544]
本稿では,CLIP などの大規模言語と視覚(LLV)モデルを組み合わせた新しい手法 AnomalyCLIP を提案する。
当社のアプローチでは、通常のイベントサブスペースを特定するために、潜伏するCLIP機能空間を操作することが特に必要です。
異常フレームがこれらの方向に投影されると、それらが特定のクラスに属している場合、大きな特徴量を示す。
論文 参考訳(メタデータ) (2023-10-04T14:01:55Z) - Multi-Contextual Predictions with Vision Transformer for Video Anomaly
Detection [22.098399083491937]
ビデオの時間的文脈を理解することは、異常検出において重要な役割を果たす。
我々は3つの異なる文脈予測ストリームを持つトランスモデルを設計する。
連続する正常フレームの欠落フレームの予測を学習することにより、ビデオ内の様々な正常パターンを効果的に学習することができる。
論文 参考訳(メタデータ) (2022-06-17T05:54:31Z) - Anomaly detection in surveillance videos using transformer based
attention model [3.2968779106235586]
本研究は、トレーニングビデオにおける異常セグメントの注釈付けを避けるために、弱教師付き戦略を用いることを示唆する。
提案するフレームワークは,実世界のデータセット,すなわちShanghaiTech Campusデータセットで検証される。
論文 参考訳(メタデータ) (2022-06-03T12:19:39Z) - Weakly Supervised Video Anomaly Detection via Center-guided
Discriminative Learning [25.787860059872106]
監視ビデオの異常検出は、異常なビデオコンテンツと持続時間の多様性のために難しい作業です。
本稿では,トレーニング段階でビデオレベルラベルのみを必要とする異常回帰ネット(ar-net)と呼ばれる異常検出フレームワークを提案する。
本手法は,上海テクデータセットにおける映像異常検出に新たな最先端結果を与える。
論文 参考訳(メタデータ) (2021-04-15T06:41:23Z) - A Self-Reasoning Framework for Anomaly Detection Using Video-Level
Labels [17.615297975503648]
監視ビデオにおける異常事象の検出は、画像およびビデオ処理コミュニティの間で困難かつ実践的な研究課題である。
本稿では、ビデオレベルラベルのみを用いて自己推論方式で訓練されたディープニューラルネットワークに基づく、弱い教師付き異常検出フレームワークを提案する。
提案するフレームワークは,UCF-crimeやShanghaiTech,Ped2など,公開されている実世界の異常検出データセット上で評価されている。
論文 参考訳(メタデータ) (2020-08-27T02:14:15Z) - Self-trained Deep Ordinal Regression for End-to-End Video Anomaly
Detection [114.9714355807607]
ビデオ異常検出に自己学習深層順序回帰を適用することで,既存の手法の2つの重要な限界を克服できることを示す。
我々は,手動で正規/異常データをラベル付けすることなく,共同表現学習と異常スコアリングを可能にする,エンドツーエンドのトレーニング可能なビデオ異常検出手法を考案した。
論文 参考訳(メタデータ) (2020-03-15T08:44:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。