論文の概要: 3D ResNet with Ranking Loss Function for Abnormal Activity Detection in
Videos
- arxiv url: http://arxiv.org/abs/2002.01132v1
- Date: Tue, 4 Feb 2020 05:32:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 03:01:23.528009
- Title: 3D ResNet with Ranking Loss Function for Abnormal Activity Detection in
Videos
- Title(参考訳): 映像中の異常な活動検出のためのランキングロス機能付き3次元ResNet
- Authors: Shikha Dubey, Abhijeet Boragule, Moongu Jeon
- Abstract要約: この研究は、最近の異常な活動検出の最先端の研究に動機づけられている。
時間的アノテーションがない場合、そのようなモデルは異常を検出しながら誤報をしがちである。
本稿では,異常行動検出タスクを実行しながら,誤警報率を最小化するタスクに焦点をあてる。
- 参考スコア(独自算出の注目度): 6.692686655277163
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Abnormal activity detection is one of the most challenging tasks in the field
of computer vision. This study is motivated by the recent state-of-art work of
abnormal activity detection, which utilizes both abnormal and normal videos in
learning abnormalities with the help of multiple instance learning by providing
the data with video-level information. In the absence of temporal-annotations,
such a model is prone to give a false alarm while detecting the abnormalities.
For this reason, in this paper, we focus on the task of minimizing the false
alarm rate while performing an abnormal activity detection task. The mitigation
of these false alarms and recent advancement of 3D deep neural network in video
action recognition task collectively give us motivation to exploit the 3D
ResNet in our proposed method, which helps to extract spatial-temporal features
from the videos. Afterwards, using these features and deep multiple instance
learning along with the proposed ranking loss, our model learns to predict the
abnormality score at the video segment level. Therefore, our proposed method 3D
deep Multiple Instance Learning with ResNet (MILR) along with the new proposed
ranking loss function achieves the best performance on the UCF-Crime benchmark
dataset, as compared to other state-of-art methods. The effectiveness of our
proposed method is demonstrated on the UCF-Crime dataset.
- Abstract(参考訳): 異常な活動検出はコンピュータビジョンの分野で最も困難なタスクの1つである。
本研究は, 異常映像と正常映像の両方を用いて, 映像レベルの情報を提供し, 複数インスタンス学習の助けを借りて異常映像を学習する, 異常行動検出の最近の研究成果に動機づけられている。
時間的アノテーションがない場合、そのようなモデルは異常を検出しながら誤報をしがちである。
そこで本稿では,異常な活動検知タスクを実行しながら,誤警報率を最小限に抑えるタスクに焦点をあてる。
ビデオ行動認識タスクにおけるこれらの誤報の軽減と最近の3Dディープニューラルネットワークの進歩は、提案手法で3D ResNetを活用する動機を与え、ビデオから時空間の特徴を抽出するのに役立つ。
その後,これらの特徴と深層マルチインスタンス学習と,提案するランキング損失を用いて,映像セグメントレベルでの異常スコアの予測を行う。
そこで,提案手法は3D Deep Multiple Instance Learning with ResNet (MILR) と新しいランキング損失関数を併用して,UCF-Crimeベンチマークデータセット上での最高の性能を実現する。
提案手法の有効性をUCF-Crimeデータセットで示す。
関連論文リスト
- Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-12T03:31:29Z) - Detection of Object Throwing Behavior in Surveillance Videos [8.841708075914353]
本稿では,ディープラーニングを用いた監視ビデオにおける投球行動検出手法を提案する。
Smart Cityプロジェクトのユースケースに対処するために、私たちはまず、新しいパブリックな"Throwing Action"データセットを生成します。
UCF-CrimeおよびThrowing-Actionデータセットにおける異常検出のための特徴抽出器の性能の比較を行った。
論文 参考訳(メタデータ) (2024-03-11T09:53:19Z) - Dynamic Erasing Network Based on Multi-Scale Temporal Features for
Weakly Supervised Video Anomaly Detection [103.92970668001277]
弱教師付きビデオ異常検出のための動的消去ネットワーク(DE-Net)を提案する。
まず,異なる長さのセグメントから特徴を抽出できるマルチスケール時間モデリングモジュールを提案する。
そして,検出された異常の完全性を動的に評価する動的消去戦略を設計する。
論文 参考訳(メタデータ) (2023-12-04T09:40:11Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Anomaly Crossing: A New Method for Video Anomaly Detection as
Cross-domain Few-shot Learning [32.0713939637202]
ビデオ異常検出は、ビデオで発生した異常事象を特定することを目的としている。
従来のアプローチのほとんどは、教師なしまたは半教師なしの手法で通常のビデオからのみ学習する。
本稿では,ビデオの異常検出に通常のビデオと異常ビデオの両方をフル活用することで,新たな学習パラダイムを提案する。
論文 参考訳(メタデータ) (2021-12-12T20:49:38Z) - Anomaly Recognition from surveillance videos using 3D Convolutional
Neural Networks [0.0]
異常なアクティビティ認識は、通常のストリームから変化するパターンやイベントを識別する。
この研究は、中央フロリダ大学犯罪ビデオデータセットに基づいて訓練された深部3次元畳み込みネットワーク(3D ConvNets)を用いて、特徴の学習にシンプルで効果的なアプローチを提供する。
論文 参考訳(メタデータ) (2021-01-04T16:32:48Z) - Anomaly Detection in Video via Self-Supervised and Multi-Task Learning [113.81927544121625]
ビデオにおける異常検出は、コンピュータビジョンの問題である。
本稿では,オブジェクトレベルでの自己教師型およびマルチタスク学習を通じて,ビデオ中の異常事象検出にアプローチする。
論文 参考訳(メタデータ) (2020-11-15T10:21:28Z) - Self-trained Deep Ordinal Regression for End-to-End Video Anomaly
Detection [114.9714355807607]
ビデオ異常検出に自己学習深層順序回帰を適用することで,既存の手法の2つの重要な限界を克服できることを示す。
我々は,手動で正規/異常データをラベル付けすることなく,共同表現学習と異常スコアリングを可能にする,エンドツーエンドのトレーニング可能なビデオ異常検出手法を考案した。
論文 参考訳(メタデータ) (2020-03-15T08:44:55Z) - ZSTAD: Zero-Shot Temporal Activity Detection [107.63759089583382]
本研究では,ゼロショット時間的活動検出(ZSTAD)と呼ばれる新たなタスク設定を提案する。
このソリューションのアーキテクチャとして,R-C3Dに基づくエンドツーエンドのディープネットワークを設計する。
THUMOS14とCharadesデータセットの両方の実験は、目に見えない活動を検出するという点で有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-03-12T02:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。