論文の概要: Pedestrian Spatio-Temporal Information Fusion For Video Anomaly
Detection
- arxiv url: http://arxiv.org/abs/2211.10052v1
- Date: Fri, 18 Nov 2022 06:41:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 15:01:07.473824
- Title: Pedestrian Spatio-Temporal Information Fusion For Video Anomaly
Detection
- Title(参考訳): 歩行者時空間情報融合による映像異常検出
- Authors: Chao Hu, Liqiang Zhu
- Abstract要約: 歩行者の情報を統合するために, 異常検出手法を提案する。
出力フレームと真値との差に応じて異常検出を行う。
The experimental results on the CUHK Avenue and ShanghaiTech datasets shows that the proposed method is superior than the current mainstream video anomaly detection method。
- 参考スコア(独自算出の注目度): 1.5736899098702974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aiming at the problem that the current video anomaly detection cannot fully
use the temporal information and ignore the diversity of normal behavior, an
anomaly detection method is proposed to integrate the spatiotemporal
information of pedestrians. Based on the convolutional autoencoder, the input
frame is compressed and restored through the encoder and decoder. Anomaly
detection is realized according to the difference between the output frame and
the true value. In order to strengthen the characteristic information
connection between continuous video frames, the residual temporal shift module
and the residual channel attention module are introduced to improve the
modeling ability of the network on temporal information and channel
information, respectively. Due to the excessive generalization of convolutional
neural networks, in the memory enhancement modules, the hopping connections of
each codec layer are added to limit autoencoders' ability to represent abnormal
frames too vigorously and improve the anomaly detection accuracy of the
network. In addition, the objective function is modified by a feature
discretization loss, which effectively distinguishes different normal behavior
patterns. The experimental results on the CUHK Avenue and ShanghaiTech datasets
show that the proposed method is superior to the current mainstream video
anomaly detection methods while meeting the real-time requirements.
- Abstract(参考訳): そこで,現在の映像異常検出では時間的情報を十分に利用できず,正常な行動の多様性を無視できない問題に着目し,歩行者の時空間的情報を統合するための異常検出手法を提案する。
畳み込みオートエンコーダに基づいて、入力フレームを圧縮してエンコーダとデコーダを介して復元する。
出力フレームと真の値との差に応じて異常検出を実現する。
連続映像フレーム間の特性情報接続を強化するため、残留時間シフトモジュールと残留チャンネルアテンションモジュールをそれぞれ導入し、時間情報およびチャンネル情報に基づくネットワークのモデリング能力を向上させる。
畳み込みニューラルネットワークの過度な一般化により、メモリ拡張モジュールでは、各コーデック層のホッピング接続が追加され、異常フレームをあまりに活発に表現し、ネットワークの異常検出精度を向上するオートエンコーダの能力を制限する。
さらに、目的関数は、異なる正常な動作パターンを効果的に区別する特徴識別損失によって修正される。
cuhk avenue と shanghaitech のデータセットにおける実験結果から,提案手法はリアルタイム要求を満たしながら,現在主流の映像異常検出手法よりも優れていることがわかった。
関連論文リスト
- Abnormal Event Detection In Videos Using Deep Embedding [0.0]
監視ビデオにおける異常事象の検出や異常検出は、現在、起こりうる事象の多様性のために課題となっている。
本稿では、ディープニューラルネットワークの目的を協調的に最適化することを目的とした、ビデオ異常検出のための教師なしアプローチを提案する。
論文 参考訳(メタデータ) (2024-09-15T17:44:51Z) - Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-12T03:31:29Z) - Patch Spatio-Temporal Relation Prediction for Video Anomaly Detection [19.643936110623653]
ビデオ異常検出(VAD)は、特定のコンテキストと時間枠内の異常を識別することを目的としている。
近年の深層学習に基づくVADモデルは,高解像度フレームの生成によって有望な結果を示した。
本稿では, パッチ間関係予測タスクを通じて, VADの自己教師型学習手法を提案する。
論文 参考訳(メタデータ) (2024-03-28T03:07:16Z) - Dynamic Erasing Network Based on Multi-Scale Temporal Features for
Weakly Supervised Video Anomaly Detection [103.92970668001277]
弱教師付きビデオ異常検出のための動的消去ネットワーク(DE-Net)を提案する。
まず,異なる長さのセグメントから特徴を抽出できるマルチスケール時間モデリングモジュールを提案する。
そして,検出された異常の完全性を動的に評価する動的消去戦略を設計する。
論文 参考訳(メタデータ) (2023-12-04T09:40:11Z) - A Spatial-Temporal Deformable Attention based Framework for Breast
Lesion Detection in Videos [107.96514633713034]
本稿では,STNet という空間的・時間的変形可能なアテンションベースのフレームワークを提案する。
我々のSTNetは、局所的な空間的時間的特徴融合を行うために、空間的時間的変形可能なアテンションモジュールを導入している。
乳腺病変の超音波画像データセットを用いた実験により,STNetは最先端の検出性能を得ることができた。
論文 参考訳(メタデータ) (2023-09-09T07:00:10Z) - A Robust and Explainable Data-Driven Anomaly Detection Approach For
Power Electronics [56.86150790999639]
本稿では,2つの異常検出・分類手法,すなわち行列プロファイルアルゴリズムと異常変換器を提案する。
行列プロファイルアルゴリズムは、ストリーミング時系列データにおけるリアルタイム異常を検出するための一般化可能なアプローチとして適している。
検知器の感度、リコール、検出精度を調整するために、一連のカスタムフィルタが作成され、追加される。
論文 参考訳(メタデータ) (2022-09-23T06:09:35Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - A Modular and Unified Framework for Detecting and Localizing Video
Anomalies [30.83924581439373]
MOVADと呼ばれるオンラインビデオ異常検出とローカリゼーション問題に対するモジュール化された統一アプローチを提案します。
新たなトランスファーラーニングベースのプラグアンドプレイアーキテクチャ、シーケンシャルな異常検出器、検出しきい値を選択する数学的フレームワーク、ビデオ中のリアルタイムな異常事象検出に適したパフォーマンス指標から構成される。
論文 参考訳(メタデータ) (2021-03-21T04:16:51Z) - Temporal-Channel Transformer for 3D Lidar-Based Video Object Detection
in Autonomous Driving [121.44554957537613]
我々は,リダデータから映像オブジェクトを検出するための時空間領域とチャネル領域の関係をモデル化する,テンポラル・チャネル変換器(Temporal-Channel Transformer)を提案する。
具体的には、トランスの時間チャネルエンコーダは、異なるチャネルやフレームの情報をエンコードするように設計されている。
我々は, nuScenesベンチマークを用いて, 格子ボクセルを用いた3次元物体検出における最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-27T09:35:39Z) - Learning Memory-guided Normality for Anomaly Detection [33.77435699029528]
本稿では,異常検出に対する教師なし学習手法を提案する。
また,メモリをトレーニングするための特徴量と分離性損失を新たに提示し,メモリアイテムの識別能力と通常のデータからの深い学習能力を高める。
論文 参考訳(メタデータ) (2020-03-30T05:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。