論文の概要: Video Anomaly Detection in 10 Years: A Survey and Outlook
- arxiv url: http://arxiv.org/abs/2405.19387v2
- Date: Mon, 1 Jul 2024 02:31:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-02 13:50:34.247298
- Title: Video Anomaly Detection in 10 Years: A Survey and Outlook
- Title(参考訳): 10年ぶりのビデオ異常検出:調査と展望
- Authors: Moshira Abdalla, Sajid Javed, Muaz Al Radi, Anwaar Ulhaq, Naoufel Werghi,
- Abstract要約: ビデオ異常検出(VAD)は、監視、医療、環境監視といった様々な領域において非常に重要である。
この調査では、従来の教師付きトレーニングパラダイムを超えて、弱教師付き、自己監督型、教師なしのアプローチを包含する、ディープラーニングベースのVADを調査している。
- 参考スコア(独自算出の注目度): 10.143205531474907
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Video anomaly detection (VAD) holds immense importance across diverse domains such as surveillance, healthcare, and environmental monitoring. While numerous surveys focus on conventional VAD methods, they often lack depth in exploring specific approaches and emerging trends. This survey explores deep learning-based VAD, expanding beyond traditional supervised training paradigms to encompass emerging weakly supervised, self-supervised, and unsupervised approaches. A prominent feature of this review is the investigation of core challenges within the VAD paradigms including large-scale datasets, features extraction, learning methods, loss functions, regularization, and anomaly score prediction. Moreover, this review also investigates the vision language models (VLMs) as potent feature extractors for VAD. VLMs integrate visual data with textual descriptions or spoken language from videos, enabling a nuanced understanding of scenes crucial for anomaly detection. By addressing these challenges and proposing future research directions, this review aims to foster the development of robust and efficient VAD systems leveraging the capabilities of VLMs for enhanced anomaly detection in complex real-world scenarios. This comprehensive analysis seeks to bridge existing knowledge gaps, provide researchers with valuable insights, and contribute to shaping the future of VAD research.
- Abstract(参考訳): ビデオ異常検出(VAD)は、監視、医療、環境監視といった様々な領域において非常に重要である。
多くの調査では従来のVAD手法に重点を置いているが、特定のアプローチや新たなトレンドを探求する深みを欠いていることが多い。
この調査では、従来の教師付きトレーニングパラダイムを超えて、弱教師付き、自己監督型、教師なしのアプローチを包含する、ディープラーニングベースのVADを調査している。
このレビューの顕著な特徴は、大規模なデータセット、特徴抽出、学習方法、損失関数、正規化、異常スコア予測を含む、VADパラダイムの中核的な課題の調査である。
さらに,視覚言語モデル(VLM)をVADの強力な特徴抽出器として検討した。
VLMは視覚データをビデオからテキスト記述や音声言語と統合し、異常検出に不可欠なシーンの微妙な理解を可能にする。
これらの課題に対処し、今後の研究方向性を提案することにより、複雑な実世界のシナリオにおいて、VLMの能力を活用した堅牢で効率的なVADシステムの開発を促進することを目的としている。
この包括的分析は、既存の知識ギャップを埋め、研究者に貴重な洞察を与え、VAD研究の将来形成に貢献しようとしている。
関連論文リスト
- ADer: A Comprehensive Benchmark for Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい異常検出手法のモジュラーフレームワークであるtextbftextitADerを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection [101.15777242546649]
Open vocabulary Object Detection (OVD) は、ベースと新規の両方のカテゴリからオブジェクトを認識できる最適なオブジェクト検出器を求めることを目的としている。
近年の進歩は、知識蒸留を利用して、事前訓練された大規模視覚言語モデルからオブジェクト検出のタスクに洞察力のある知識を伝達している。
本稿では,暗黙的背景知識を活用するための学習バックグラウンドプロンプトを提案するため,LBPと呼ばれる新しいOVDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-01T17:32:26Z) - Few-Shot Object Detection: Research Advances and Challenges [15.916463121997843]
Few-shot Object Detection (FSOD)は、少数の学習技術とオブジェクト検出技術を組み合わせて、注釈付きサンプルに制限のある新しいオブジェクトに迅速に適応する。
本稿では,近年のFSOD分野の進歩を概観する包括的調査を行う。
論文 参考訳(メタデータ) (2024-04-07T03:37:29Z) - Object Detectors in the Open Environment: Challenges, Solutions, and Outlook [95.3317059617271]
オープン環境のダイナミックで複雑な性質は、オブジェクト検出器に新しくて恐ろしい挑戦をもたらす。
本稿では,オープン環境におけるオブジェクト検出器の総合的なレビューと解析を行う。
データ/ターゲットの変化の次元に基づいて、4つの四分法(ドメイン外、カテゴリ外、堅牢な学習、漸進的な学習)を含むフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-24T19:32:39Z) - Advancing Video Anomaly Detection: A Concise Review and a New Dataset [8.822253683273841]
ビデオ異常検出(VAD)は、セキュリティ監視、交通監視、産業監視、医療に広く応用されている。
大規模な研究努力にもかかわらず、研究者に洞察力のあるガイダンスを提供する簡潔なレビューは残っていない。
本稿では,様々な視点からモデルとデータセットを考察する。
論文 参考訳(メタデータ) (2024-02-07T13:54:56Z) - A Comprehensive Survey of Forgetting in Deep Learning Beyond Continual
Learning [76.47138162283714]
蓄積とは、以前取得した情報や知識の喪失または劣化を指す。
フォッテッティングは、深層学習における様々な研究領域でよく見られる現象である。
調査では、忘れることは二重刃の剣であり、ある場合には有益で望ましいと論じている。
論文 参考訳(メタデータ) (2023-07-16T16:27:58Z) - Generalized Video Anomaly Event Detection: Systematic Taxonomy and
Comparison of Deep Models [33.43062232461652]
ビデオ異常検出(VAD)は、インテリジェント監視システムにおいて重要な技術である。
本調査は,GA(Generalized Video Anomaly Event Detection, GVAED)と呼ばれる幅広いスペクトルを含む,教師なしの手法を超えて,従来のVODの範囲を拡張した。
論文 参考訳(メタデータ) (2023-02-10T07:11:37Z) - An Overview of Violence Detection Techniques: Current Challenges and
Future Directions [8.978422921103617]
バイオレンス検出(VD)は、人間によって引き起こされる異常な動作のビッグビデオデータを分析するために用いられる。
本稿では、検出された暴力の局所化戦略とともに、ディープシークエンス学習のアプローチの概要に焦点を当てる。
論文 参考訳(メタデータ) (2022-09-21T12:27:20Z) - A Critical Study on the Recent Deep Learning Based Semi-Supervised Video
Anomaly Detection Methods [3.198144010381572]
本稿では,この分野の研究者を新たな視点に紹介し,最近の深層学習に基づく半教師付きビデオ異常検出手法についてレビューする。
私たちのゴールは、より効果的なビデオ異常検出方法の開発を支援することです。
論文 参考訳(メタデータ) (2021-11-02T14:00:33Z) - Deep Learning for Anomaly Detection: A Review [150.9270911031327]
本稿では,3つの高レベルカテゴリと11の細粒度カテゴリの進歩を網羅した包括的分類法による深部異常検出の研究について調査する。
我々は、それらの重要な直観、客観的機能、基礎となる仮定、利点とデメリットをレビューし、上記の課題にどのように対処するかについて議論する。
論文 参考訳(メタデータ) (2020-07-06T02:21:16Z) - Anomalous Example Detection in Deep Learning: A Survey [98.2295889723002]
本調査は,ディープラーニングアプリケーションにおける異常検出の研究について,構造化された包括的概要を提供する。
既存の技術に対する分類法を,その基礎となる前提と採用アプローチに基づいて提案する。
本稿では,DLシステムに異常検出技術を適用しながら未解決の研究課題を取り上げ,今後の課題について述べる。
論文 参考訳(メタデータ) (2020-03-16T02:47:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。