論文の概要: Anomaly Detection in Video Sequences: A Benchmark and Computational
Model
- arxiv url: http://arxiv.org/abs/2106.08570v1
- Date: Wed, 16 Jun 2021 06:34:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-18 05:45:41.905391
- Title: Anomaly Detection in Video Sequences: A Benchmark and Computational
Model
- Title(参考訳): ビデオシーケンス中の異常検出:ベンチマークと計算モデル
- Authors: Boyang Wan and Wenhui Jiang and Yuming Fang and Zhiyuan Luo and
Guanqun Ding
- Abstract要約: 本稿では,ビデオシーケンスにおける異常検出のベンチマークとして,新しい大規模異常検出(LAD)データベースを提案する。
通常のビデオクリップや異常なビデオクリップを含む2000の動画シーケンスが含まれており、クラッシュ、火災、暴力など14の異常なカテゴリーがある。
ビデオレベルラベル(異常/正常ビデオ、異常タイプ)やフレームレベルラベル(異常/正常ビデオフレーム)を含むアノテーションデータを提供し、異常検出を容易にする。
完全教師付き学習問題として異常検出を解くために,マルチタスク深層ニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 25.25968958782081
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection has attracted considerable search attention. However,
existing anomaly detection databases encounter two major problems. Firstly,
they are limited in scale. Secondly, training sets contain only video-level
labels indicating the existence of an abnormal event during the full video
while lacking annotations of precise time durations. To tackle these problems,
we contribute a new Large-scale Anomaly Detection (LAD) database as the
benchmark for anomaly detection in video sequences, which is featured in two
aspects. 1) It contains 2000 video sequences including normal and abnormal
video clips with 14 anomaly categories including crash, fire, violence, etc.
with large scene varieties, making it the largest anomaly analysis database to
date. 2) It provides the annotation data, including video-level labels
(abnormal/normal video, anomaly type) and frame-level labels (abnormal/normal
video frame) to facilitate anomaly detection. Leveraging the above benefits
from the LAD database, we further formulate anomaly detection as a
fully-supervised learning problem and propose a multi-task deep neural network
to solve it. We first obtain the local spatiotemporal contextual feature by
using an Inflated 3D convolutional (I3D) network. Then we construct a recurrent
convolutional neural network fed the local spatiotemporal contextual feature to
extract the spatiotemporal contextual feature. With the global spatiotemporal
contextual feature, the anomaly type and score can be computed simultaneously
by a multi-task neural network. Experimental results show that the proposed
method outperforms the state-of-the-art anomaly detection methods on our
database and other public databases of anomaly detection. Codes are available
at https://github.com/wanboyang/anomaly_detection_LAD2000.
- Abstract(参考訳): 異常検出は検索の注意を惹きつけている。
しかし、既存の異常検出データベースには2つの大きな問題がある。
第一に、規模は限られている。
第2に,トレーニングセットには,映像中の異常事象の存在を示すビデオレベルラベルのみが含まれているが,正確な時間長のアノテーションが欠落している。
これらの問題に対処するため,ビデオシーケンスにおける異常検出のためのベンチマークとして,大規模異常検出(LAD)データベースを新たに提案する。
1) 事故, 火災, 暴力などの異常なカテゴリーが14ある, 正常および異常なビデオクリップを含む2000の動画シーケンスを含む。
大規模なシーンのバリエーションがあるため、これまでで最大の異常解析データベースとなっている。
2)ビデオレベルラベル(異常/正常/異常型)及びフレームレベルラベル(異常/正常/正常ビデオフレーム)を含むアノテーションデータを提供し、異常検出を容易にする。
上記のladデータベースの利点を生かして,完全な教師付き学習問題として異常検出をさらに定式化し,それを解決するマルチタスク深層ニューラルネットワークを提案する。
まず,Inflated 3D convolutional (I3D) ネットワークを用いて局所時空間特性を求める。
次に,局所時空間特徴を付加した反復畳み込みニューラルネットワークを構築し,時空間特徴を抽出した。
グローバルな時空間的特徴により、異常型とスコアはマルチタスクニューラルネットワークによって同時に計算できる。
実験の結果,提案手法は,我々のデータベースや一般の異常検出データベースにおける最先端異常検出手法よりも優れていることがわかった。
コードはhttps://github.com/wanboyang/anomaly_detection_lad2000で入手できる。
関連論文リスト
- Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-12T03:31:29Z) - Dynamic Erasing Network Based on Multi-Scale Temporal Features for
Weakly Supervised Video Anomaly Detection [103.92970668001277]
弱教師付きビデオ異常検出のための動的消去ネットワーク(DE-Net)を提案する。
まず,異なる長さのセグメントから特徴を抽出できるマルチスケール時間モデリングモジュールを提案する。
そして,検出された異常の完全性を動的に評価する動的消去戦略を設計する。
論文 参考訳(メタデータ) (2023-12-04T09:40:11Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Towards Video Anomaly Retrieval from Video Anomaly Detection: New
Benchmarks and Model [70.97446870672069]
ビデオ異常検出(VAD)はその潜在的な応用により注目されている。
Video Anomaly Retrieval (VAR)は、関連のある動画をモダリティによって実用的に検索することを目的としている。
一般的な異常データセットの上に構築されたUCFCrime-ARとXD-Violenceの2つのベンチマークを示す。
論文 参考訳(メタデータ) (2023-07-24T06:22:37Z) - CHAD: Charlotte Anomaly Dataset [2.6774008509840996]
ビデオ異常検出のためのシャーロット異常データセット(CHAD)を提案する。
CHADはバウンディングボックス、アイデンティティ、各アクターのアノテーションを含む最初の異常データセットである。
4つのカメラビューと115万フレーム以上を持つCHADは、完全注釈付き異常検出データセットとしては最大である。
論文 参考訳(メタデータ) (2022-12-19T06:05:34Z) - Anomaly detection in surveillance videos using transformer based
attention model [3.2968779106235586]
本研究は、トレーニングビデオにおける異常セグメントの注釈付けを避けるために、弱教師付き戦略を用いることを示唆する。
提案するフレームワークは,実世界のデータセット,すなわちShanghaiTech Campusデータセットで検証される。
論文 参考訳(メタデータ) (2022-06-03T12:19:39Z) - UBnormal: New Benchmark for Supervised Open-Set Video Anomaly Detection [103.06327681038304]
本稿では,複数の仮想シーンで構成された教師付きオープンセット・ベンチマークを提案する。
既存のデータセットとは異なり、トレーニング時に画素レベルでアノテートされた異常事象を導入する。
UBnormalは最先端の異常検出フレームワークの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2021-11-16T17:28:46Z) - Weakly Supervised Video Anomaly Detection via Center-guided
Discriminative Learning [25.787860059872106]
監視ビデオの異常検出は、異常なビデオコンテンツと持続時間の多様性のために難しい作業です。
本稿では,トレーニング段階でビデオレベルラベルのみを必要とする異常回帰ネット(ar-net)と呼ばれる異常検出フレームワークを提案する。
本手法は,上海テクデータセットにおける映像異常検出に新たな最先端結果を与える。
論文 参考訳(メタデータ) (2021-04-15T06:41:23Z) - Unsupervised Video Anomaly Detection via Normalizing Flows with Implicit
Latent Features [8.407188666535506]
既存のほとんどのメソッドはオートエンコーダを使用して、通常のビデオの再構築を学ぶ。
本稿では2つのエンコーダが暗黙的に外観と動きの特徴をモデル化する構造である暗黙の2経路AE(ITAE)を提案する。
通常のシーンの複雑な分布については,ITAE特徴量の正規密度推定を提案する。
NFモデルは暗黙的に学習された機能を通じて正常性を学ぶことでITAEのパフォーマンスを高める。
論文 参考訳(メタデータ) (2020-10-15T05:02:02Z) - A Self-Reasoning Framework for Anomaly Detection Using Video-Level
Labels [17.615297975503648]
監視ビデオにおける異常事象の検出は、画像およびビデオ処理コミュニティの間で困難かつ実践的な研究課題である。
本稿では、ビデオレベルラベルのみを用いて自己推論方式で訓練されたディープニューラルネットワークに基づく、弱い教師付き異常検出フレームワークを提案する。
提案するフレームワークは,UCF-crimeやShanghaiTech,Ped2など,公開されている実世界の異常検出データセット上で評価されている。
論文 参考訳(メタデータ) (2020-08-27T02:14:15Z) - Self-trained Deep Ordinal Regression for End-to-End Video Anomaly
Detection [114.9714355807607]
ビデオ異常検出に自己学習深層順序回帰を適用することで,既存の手法の2つの重要な限界を克服できることを示す。
我々は,手動で正規/異常データをラベル付けすることなく,共同表現学習と異常スコアリングを可能にする,エンドツーエンドのトレーニング可能なビデオ異常検出手法を考案した。
論文 参考訳(メタデータ) (2020-03-15T08:44:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。