論文の概要: Beyond the Benchmark: Detecting Diverse Anomalies in Videos
- arxiv url: http://arxiv.org/abs/2310.01904v1
- Date: Tue, 3 Oct 2023 09:22:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-04 14:57:39.697228
- Title: Beyond the Benchmark: Detecting Diverse Anomalies in Videos
- Title(参考訳): ベンチマークを超えて:ビデオのさまざまな異常を検出する
- Authors: Yoav Arad, Michael Werman
- Abstract要約: ビデオ異常検出(VAD)は、現代の監視システムにおいて重要な役割を担い、現実の状況における様々な異常を識別することを目的としている。
現在のベンチマークデータセットは、新しいオブジェクト検出のような単純な単一フレームの異常を主に強調している。
我々は,従来のベンチマーク境界を超える複雑な異常を包含するVAD調査の拡大を提唱する。
- 参考スコア(独自算出の注目度): 0.6993026261767287
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Video Anomaly Detection (VAD) plays a crucial role in modern surveillance
systems, aiming to identify various anomalies in real-world situations.
However, current benchmark datasets predominantly emphasize simple,
single-frame anomalies such as novel object detection. This narrow focus
restricts the advancement of VAD models. In this research, we advocate for an
expansion of VAD investigations to encompass intricate anomalies that extend
beyond conventional benchmark boundaries. To facilitate this, we introduce two
datasets, HMDB-AD and HMDB-Violence, to challenge models with diverse
action-based anomalies. These datasets are derived from the HMDB51 action
recognition dataset. We further present Multi-Frame Anomaly Detection (MFAD), a
novel method built upon the AI-VAD framework. AI-VAD utilizes single-frame
features such as pose estimation and deep image encoding, and two-frame
features such as object velocity. They then apply a density estimation
algorithm to compute anomaly scores. To address complex multi-frame anomalies,
we add a deep video encoding features capturing long-range temporal
dependencies, and logistic regression to enhance final score calculation.
Experimental results confirm our assumptions, highlighting existing models
limitations with new anomaly types. MFAD excels in both simple and complex
anomaly detection scenarios.
- Abstract(参考訳): ビデオ異常検出(vad: video anomaly detection)は、現代の監視システムにおいて重要な役割を果たす。
しかし、現在のベンチマークデータセットは主に、新しいオブジェクト検出のような単純な単一フレーム異常を強調している。
この狭い焦点はvadモデルの進歩を制限する。
本研究では,従来のベンチマーク境界を超える複雑な異常を包含するvad調査の拡大を提唱する。
これを容易にするために,HMDB-ADとHMDB-Violenceという2つのデータセットを導入する。
これらのデータセットは、HMDB51アクション認識データセットに由来する。
さらに,AI-VADフレームワーク上に構築された新しい手法であるMulti-Frame Anomaly Detection (MFAD)を提案する。
AI-VADは、ポーズ推定やディープイメージエンコーディングのような単一フレーム機能と、オブジェクト速度のような2フレーム機能を利用する。
そして、異常スコアを計算するために密度推定アルゴリズムを適用する。
複雑なマルチフレーム異常に対処するために,長距離時間依存性をキャプチャするディープビデオエンコーディング機能と,最終スコア計算のロジスティックレグレッションを追加した。
実験の結果,既存モデルの制約を新しい異常型で強調し,仮定を確認した。
MFADは単純かつ複雑な異常検出シナリオに優れる。
関連論文リスト
- Are Anomaly Scores Telling the Whole Story? A Benchmark for Multilevel Anomaly Detection [46.244213695024]
異常検出(AD)は、通常のトレーニングデータからパターンを学習することで異常を識別する機械学習タスクである。
既存のモデルは、主にバイナリ環境で動作し、それらが生成する異常スコアは通常、通常のデータからのデータポイントのずれに基づいている。
本稿では,実世界のアプリケーションにおける異常の重症度を表す,新しい設定であるマルチレベルAD(MAD)を提案する。
第2に,新たなベンチマークMAD-Benchを導入する。このベンチマークでは,異常検出能力だけでなく,異常スコアが重大度をどの程度効果的に反映しているかをモデルとして評価する。
論文 参考訳(メタデータ) (2024-11-21T14:18:37Z) - VANE-Bench: Video Anomaly Evaluation Benchmark for Conversational LMMs [64.60035916955837]
VANE-Benchはビデオの異常や矛盾を検出するためのビデオLMMの熟練度を評価するために設計されたベンチマークである。
我々のデータセットは、既存の最先端のテキスト・ビデオ生成モデルを用いて合成された一連のビデオから構成される。
我々は、このベンチマークタスクにおいて、オープンソースとクローズドソースの両方で既存の9つのビデオLMMを評価し、ほとんどのモデルが微妙な異常を効果的に識別するのに困難に直面することを発見した。
論文 参考訳(メタデータ) (2024-06-14T17:59:01Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - Dynamic Erasing Network Based on Multi-Scale Temporal Features for
Weakly Supervised Video Anomaly Detection [103.92970668001277]
弱教師付きビデオ異常検出のための動的消去ネットワーク(DE-Net)を提案する。
まず,異なる長さのセグメントから特徴を抽出できるマルチスケール時間モデリングモジュールを提案する。
そして,検出された異常の完全性を動的に評価する動的消去戦略を設計する。
論文 参考訳(メタデータ) (2023-12-04T09:40:11Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Time-series Anomaly Detection via Contextual Discriminative Contrastive
Learning [0.0]
一級分類法は、異常検出タスクに一般的に使用される。
本稿では,DeepSVDDの損失関数に着想を得た新しい手法を提案する。
我々は,我々のアプローチと,将来有望な自己教師型学習異常検出手法であるNeutral ADによる決定論的コントラスト損失を組み合わせた。
論文 参考訳(メタデータ) (2023-04-16T21:36:19Z) - Exploring Diffusion Models for Unsupervised Video Anomaly Detection [17.816344808780965]
本稿では,ビデオ異常検出(VAD)における拡散モデルの性能について検討する。
2つの大規模異常検出データセットで実施された実験は、最先端の生成モデルよりも提案手法の一貫性のある改善を実証している。
本研究は, 拡散モデルを用いて, 監視シナリオにおけるVOD検査の指針を示す最初の研究である。
論文 参考訳(メタデータ) (2023-04-12T13:16:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。