論文の概要: Making Reconstruction-based Method Great Again for Video Anomaly
Detection
- arxiv url: http://arxiv.org/abs/2301.12048v1
- Date: Sat, 28 Jan 2023 01:57:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 19:33:59.968801
- Title: Making Reconstruction-based Method Great Again for Video Anomaly
Detection
- Title(参考訳): 映像異常検出のための再構成ベース手法の再検討
- Authors: Yizhou Wang, Can Qin, Yue Bai, Yi Xu, Xu Ma, Yun Fu
- Abstract要約: ビデオの異常検出は重要な問題だが、難しい問題だ。
既存の再構成に基づく手法は、昔ながらの畳み込みオートエンコーダに依存している。
連続フレーム再構築のための新しいオートエンコーダモデルを提案する。
- 参考スコア(独自算出の注目度): 64.19326819088563
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection in videos is a significant yet challenging problem.
Previous approaches based on deep neural networks employ either
reconstruction-based or prediction-based approaches. Nevertheless, existing
reconstruction-based methods 1) rely on old-fashioned convolutional
autoencoders and are poor at modeling temporal dependency; 2) are prone to
overfit the training samples, leading to indistinguishable reconstruction
errors of normal and abnormal frames during the inference phase. To address
such issues, firstly, we get inspiration from transformer and propose ${\textbf
S}$patio-${\textbf T}$emporal ${\textbf A}$uto-${\textbf T}$rans-${\textbf
E}$ncoder, dubbed as $\textbf{STATE}$, as a new autoencoder model for enhanced
consecutive frame reconstruction. Our STATE is equipped with a specifically
designed learnable convolutional attention module for efficient temporal
learning and reasoning. Secondly, we put forward a novel reconstruction-based
input perturbation technique during testing to further differentiate anomalous
frames. With the same perturbation magnitude, the testing reconstruction error
of the normal frames lowers more than that of the abnormal frames, which
contributes to mitigating the overfitting problem of reconstruction. Owing to
the high relevance of the frame abnormality and the objects in the frame, we
conduct object-level reconstruction using both the raw frame and the
corresponding optical flow patches. Finally, the anomaly score is designed
based on the combination of the raw and motion reconstruction errors using
perturbed inputs. Extensive experiments on benchmark video anomaly detection
datasets demonstrate that our approach outperforms previous
reconstruction-based methods by a notable margin, and achieves state-of-the-art
anomaly detection performance consistently. The code is available at
https://github.com/wyzjack/MRMGA4VAD.
- Abstract(参考訳): ビデオにおける異常検出は、非常に難しい問題である。
ディープニューラルネットワークに基づく以前のアプローチでは、レコンストラクションベースか予測ベースのアプローチを採用している。
それにもかかわらず、既存の再建法
1) 昔ながらの畳み込み自己エンコーダに頼り、時間的依存のモデル化に乏しい。
2) トレーニングサンプルに過度に適合する傾向があり, 推測段階での正常フレームと異常フレームの復元誤りが相違する。
そのような問題に対処するために、まず、transformer s}$patio-${\textbf t}$emporal ${\textbf a}$uto-${\textbf t}$rans-${\textbf e}$ncoder、$\textbf{state}$と呼ばれる新しい連続フレーム再構成のためのオートエンコーダモデルを提案する。
私たちの状態は、効率的な時間学習と推論のための、特別に設計された学習可能な畳み込み注意モジュールを備えています。
第2に,異常フレームを更に区別するために,新しい再構成に基づく入力摂動手法を提案する。
同じ摂動の大きさで、通常のフレームの試験再構成誤差は異常フレームの試験誤差よりも小さくなり、再構成の過度な問題を軽減するのに寄与する。
フレームの異常とフレーム内のオブジェクトの関連性が高いため、原フレームと対応する光フローパッチの両方を用いてオブジェクトレベルの再構成を行う。
最後に、乱れ入力を用いた生と動の復元誤差の組み合わせに基づいて、異常スコアを設計する。
ベンチマークビデオ異常検出データセットに関する広範囲な実験により,本手法が従来の再構成ベース手法を有意なマージンで上回り,最先端異常検出性能を一貫して達成していることが示された。
コードはhttps://github.com/wyzjack/mrmga4vadで入手できる。
関連論文リスト
- Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Multi-Contextual Predictions with Vision Transformer for Video Anomaly
Detection [22.098399083491937]
ビデオの時間的文脈を理解することは、異常検出において重要な役割を果たす。
我々は3つの異なる文脈予測ストリームを持つトランスモデルを設計する。
連続する正常フレームの欠落フレームの予測を学習することにより、ビデオ内の様々な正常パターンを効果的に学習することができる。
論文 参考訳(メタデータ) (2022-06-17T05:54:31Z) - Unsupervised Anomaly Detection in Medical Images with a Memory-augmented
Multi-level Cross-attentional Masked Autoencoder [33.5760501931736]
教師なし異常検出(UAD)は、通常の画像のみを含むトレーニングセットを使用して検出器を最適化することにより、異常な画像を見つけることを目的としている。
UADアプローチは、再構成方法、自己教師付きアプローチ、およびImagenet事前訓練モデルに基づくことができる。
異常画像に対する低い再構成誤差問題に対処する新しい再構成に基づくUDA手法を提案する。
論文 参考訳(メタデータ) (2022-03-22T13:32:42Z) - Self-Supervised Predictive Convolutional Attentive Block for Anomaly
Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。
我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。
画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文 参考訳(メタデータ) (2021-11-17T13:30:31Z) - Robust lEarned Shrinkage-Thresholding (REST): Robust unrolling for
sparse recover [87.28082715343896]
我々は、モデルミス特定を前進させるのに堅牢な逆問題を解決するためのディープニューラルネットワークについて検討する。
我々は,アルゴリズムの展開手法を根底にある回復問題のロバストバージョンに適用することにより,新しい堅牢なディープニューラルネットワークアーキテクチャを設計する。
提案したRESTネットワークは,圧縮センシングとレーダイメージングの両問題において,最先端のモデルベースおよびデータ駆動アルゴリズムを上回る性能を示す。
論文 参考訳(メタデータ) (2021-10-20T06:15:45Z) - A Hybrid Video Anomaly Detection Framework via Memory-Augmented Flow
Reconstruction and Flow-Guided Frame Prediction [34.565986275769745]
$textHF2$-VADは、フロー再構成とFrame予測を統合するハイブリッドフレームワークである。
ML-MemAE-SCのネットワークを設計し,光学的フロー再構成のための正規パターンを記憶する。
次に, 条件付き変分オートエンコーダを用いて, 前の数フレームから次のフレームを予測する。
論文 参考訳(メタデータ) (2021-08-16T01:37:29Z) - Divide-and-Assemble: Learning Block-wise Memory for Unsupervised Anomaly
Detection [40.778313918994996]
再構成に基づく手法は、画像の教師なし異常検出において重要な役割を果たす。
本研究では,画像の再構成を分割組立手順として解釈する。
我々は、挑戦的なMVTec ADデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-07-28T01:14:32Z) - Anomaly Detection with Prototype-Guided Discriminative Latent Embeddings [29.93983580779689]
本論文では,通常のデータの識別的プロトタイプを用いて映像フレームを再構築する異常検出手法を提案する。
このようにして、モデルは通常のイベントの再構築を支持し、異常なイベントの再構築を歪めます。
本手法の有効性を3つのベンチマークデータセットで評価し,提案手法が最先端を上回っていることを示す。
論文 参考訳(メタデータ) (2021-04-30T12:16:52Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。