論文の概要: A Modular and Unified Framework for Detecting and Localizing Video
Anomalies
- arxiv url: http://arxiv.org/abs/2103.11299v1
- Date: Sun, 21 Mar 2021 04:16:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 08:37:12.076264
- Title: A Modular and Unified Framework for Detecting and Localizing Video
Anomalies
- Title(参考訳): ビデオ異常の検出とローカライズのためのモジュール型統一フレームワーク
- Authors: Keval Doshi and Yasin Yilmaz
- Abstract要約: MOVADと呼ばれるオンラインビデオ異常検出とローカリゼーション問題に対するモジュール化された統一アプローチを提案します。
新たなトランスファーラーニングベースのプラグアンドプレイアーキテクチャ、シーケンシャルな異常検出器、検出しきい値を選択する数学的フレームワーク、ビデオ中のリアルタイムな異常事象検出に適したパフォーマンス指標から構成される。
- 参考スコア(独自算出の注目度): 30.83924581439373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection in videos has been attracting an increasing amount of
attention. Despite the competitive performance of recent methods on benchmark
datasets, they typically lack desirable features such as modularity,
cross-domain adaptivity, interpretability, and real-time anomalous event
detection. Furthermore, current state-of-the-art approaches are evaluated using
the standard instance-based detection metric by considering video frames as
independent instances, which is not ideal for video anomaly detection.
Motivated by these research gaps, we propose a modular and unified approach to
the online video anomaly detection and localization problem, called MOVAD,
which consists of a novel transfer learning based plug-and-play architecture, a
sequential anomaly detector, a mathematical framework for selecting the
detection threshold, and a suitable performance metric for real-time anomalous
event detection in videos. Extensive performance evaluations on benchmark
datasets show that the proposed framework significantly outperforms the current
state-of-the-art approaches.
- Abstract(参考訳): ビデオにおける異常検出は、ますます注目を集めている。
ベンチマークデータセットにおける最近の方法の競合性能にもかかわらず、モジュール性、クロスドメイン適応性、解釈性、リアルタイム異常なイベント検出といった望ましい機能が欠如している。
さらに,映像の異常検出には理想的ではない映像フレームを独立したインスタンスとして考慮し,標準のインスタンスベース検出メトリックを用いて現在の最先端手法を評価する。
これらの研究のギャップに動機付けられ、movadと呼ばれるオンラインビデオ異常検出とローカライズ問題に対するモジュラーで統一的なアプローチを提案する。movadは、新しい転送学習ベースのプラグアンドプレイアーキテクチャ、シーケンシャル異常検出器、検出しきい値の選択のための数学的フレームワーク、ビデオにおけるリアルタイム異常イベント検出に適したパフォーマンス指標で構成されている。
ベンチマークデータセットの大規模なパフォーマンス評価は、提案フレームワークが現在の最先端アプローチを大きく上回っていることを示している。
関連論文リスト
- Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-12T03:31:29Z) - VANE-Bench: Video Anomaly Evaluation Benchmark for Conversational LMMs [64.60035916955837]
VANE-Benchはビデオの異常や矛盾を検出するためのビデオLMMの熟練度を評価するために設計されたベンチマークである。
我々のデータセットは、既存の最先端のテキスト・ビデオ生成モデルを用いて合成された一連のビデオから構成される。
我々は、このベンチマークタスクにおいて、オープンソースとクローズドソースの両方で既存の9つのビデオLMMを評価し、ほとんどのモデルが微妙な異常を効果的に識別するのに困難に直面することを発見した。
論文 参考訳(メタデータ) (2024-06-14T17:59:01Z) - Dynamic Erasing Network Based on Multi-Scale Temporal Features for
Weakly Supervised Video Anomaly Detection [103.92970668001277]
弱教師付きビデオ異常検出のための動的消去ネットワーク(DE-Net)を提案する。
まず,異なる長さのセグメントから特徴を抽出できるマルチスケール時間モデリングモジュールを提案する。
そして,検出された異常の完全性を動的に評価する動的消去戦略を設計する。
論文 参考訳(メタデータ) (2023-12-04T09:40:11Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - A Lightweight Video Anomaly Detection Model with Weak Supervision and Adaptive Instance Selection [14.089888316857426]
本稿では,弱教師付きビデオ異常検出に焦点をあてる。
我々は,軽量なビデオ異常検出モデルを開発した。
我々のモデルは、最先端の手法と比較して、AUCのスコアに匹敵するか、さらに優れていることを示す。
論文 参考訳(メタデータ) (2023-10-09T01:23:08Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z) - A Background-Agnostic Framework with Adversarial Training for Abnormal
Event Detection in Video [120.18562044084678]
近年,ビデオにおける異常事象検出は複雑なコンピュータビジョンの問題として注目されている。
通常のイベントのみを含むトレーニングビデオから学習するバックグラウンドに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-27T18:39:24Z) - A Self-Reasoning Framework for Anomaly Detection Using Video-Level
Labels [17.615297975503648]
監視ビデオにおける異常事象の検出は、画像およびビデオ処理コミュニティの間で困難かつ実践的な研究課題である。
本稿では、ビデオレベルラベルのみを用いて自己推論方式で訓練されたディープニューラルネットワークに基づく、弱い教師付き異常検出フレームワークを提案する。
提案するフレームワークは,UCF-crimeやShanghaiTech,Ped2など,公開されている実世界の異常検出データセット上で評価されている。
論文 参考訳(メタデータ) (2020-08-27T02:14:15Z) - Localizing Anomalies from Weakly-Labeled Videos [45.58643708315132]
Weakly Supervised Anomaly Localization (WSAL)法を提案する。
異常映像の出現差にインスパイアされ, 隣接する時間領域の進化を異常映像の局所化のために評価した。
提案手法は,UCF-CrimeおよびTADデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2020-08-20T12:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。