論文の概要: An Overview of Violence Detection Techniques: Current Challenges and
Future Directions
- arxiv url: http://arxiv.org/abs/2209.11680v1
- Date: Wed, 21 Sep 2022 12:27:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 13:34:47.985465
- Title: An Overview of Violence Detection Techniques: Current Challenges and
Future Directions
- Title(参考訳): バイオレンス検出技術の概観:現状と今後の展望
- Authors: Nadia Mumtaz, Naveed Ejaz, Shabana Habib, Syed Muhammad Mohsin, Prayag
Tiwari, Shahab S. Band, Neeraj Kumar
- Abstract要約: バイオレンス検出(VD)は、人間によって引き起こされる異常な動作のビッグビデオデータを分析するために用いられる。
本稿では、検出された暴力の局所化戦略とともに、ディープシークエンス学習のアプローチの概要に焦点を当てる。
- 参考スコア(独自算出の注目度): 8.978422921103617
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Big Video Data generated in today's smart cities has raised concerns from
its purposeful usage perspective, where surveillance cameras, among many others
are the most prominent resources to contribute to the huge volumes of data,
making its automated analysis a difficult task in terms of computation and
preciseness. Violence Detection (VD), broadly plunging under Action and
Activity recognition domain, is used to analyze Big Video data for anomalous
actions incurred due to humans. The VD literature is traditionally based on
manually engineered features, though advancements to deep learning based
standalone models are developed for real-time VD analysis. This paper focuses
on overview of deep sequence learning approaches along with localization
strategies of the detected violence. This overview also dives into the initial
image processing and machine learning-based VD literature and their possible
advantages such as efficiency against the current complex models.
Furthermore,the datasets are discussed, to provide an analysis of the current
models, explaining their pros and cons with future directions in VD domain
derived from an in-depth analysis of the previous methods.
- Abstract(参考訳): 今日のスマートシティーで生成されたビッグデータは、監視カメラが膨大な量のデータに寄与する最も顕著なリソースであり、計算と正確性の観点からは自動分析が難しい課題となっているという、その目的のある利用の観点から懸念を喚起している。
暴力検出(vd、英: violence detection)は、行動や活動の認識領域で広く認知される、人間の異常な行動に対するビッグデータを分析するために用いられる。
VD文学は伝統的に手動で設計された機能に基づいているが、ディープラーニングベースのスタンドアロンモデルへの進歩はリアルタイムなVD分析のために開発されている。
本稿では,検出された暴力のローカライズ戦略とともに,ディープシーケンス学習のアプローチの概要について述べる。
この概要は、初期の画像処理と機械学習ベースのvd文献、そして現在の複雑なモデルに対する効率性など、それらの利点にも目を向ける。
さらに,従来の手法の深部分析から得られたVD領域におけるモデルの有効性と今後の方向性を説明するため,これらのデータセットについて考察した。
関連論文リスト
- Temporal DINO: A Self-supervised Video Strategy to Enhance Action
Prediction [15.696593695918844]
本稿では、DINOにインスパイアされた行動予測(ラベルのない自己蒸留)を強化するための、新しい自己教師型ビデオ戦略を提案する。
実験結果は、3D-ResNet、Transformer、LSTMアーキテクチャで予測性能が大幅に向上したことを示している。
これらの知見は,行動認識,運動計画,シーン理解など,多様な映像ベースタスクにおけるアプローチの可能性を強調した。
論文 参考訳(メタデータ) (2023-08-08T21:18:23Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Video Unsupervised Domain Adaptation with Deep Learning: A Comprehensive
Survey [32.526118672614345]
行動認識などのビデオ分析タスクは、スマートヘルスケアなどの分野における応用の増大に対して、研究の関心が高まっている。
既存のデータセットでトレーニングされたビデオモデルは、現実世界のアプリケーションに直接デプロイした場合、大幅にパフォーマンスが低下する。
ラベル付きソースドメインからラベル付きターゲットドメインにビデオモデルを適用するために、ビデオアン教師付きドメイン適応(VUDA)が導入される。
論文 参考訳(メタデータ) (2022-11-17T05:05:42Z) - EMA-VIO: Deep Visual-Inertial Odometry with External Memory Attention [5.144653418944836]
視覚慣性オドメトリー(VIO)アルゴリズムは、カメラと慣性センサーからの情報を利用して位置と翻訳を推定する。
最近のディープラーニングベースのVIOモデルは、データ駆動方式でポーズ情報を提供するため、注目を集めている。
状態推定のための視覚的特徴と慣性的特徴を効果的かつ効率的に組み合わせた,外部記憶に配慮した新しい学習ベースのVIOフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-18T07:05:36Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Temporal Relevance Analysis for Video Action Models [70.39411261685963]
まず,CNNに基づく行動モデルにより捉えたフレーム間の時間的関係を定量化する手法を提案する。
次に、時間的モデリングがどのように影響を受けるかをよりよく理解するために、包括的な実験と詳細な分析を行います。
論文 参考訳(メタデータ) (2022-04-25T19:06:48Z) - How Facial Features Convey Attention in Stationary Environments [0.0]
本研究は,視覚的特徴が認知と疲労の予測に最も寄与する要因を分析することによって,従来の注意欠陥検出研究を拡大することを目的とする。
被験者の視覚データを様々なレベルの注意度で分析するために,オープンソースの顔分析ツールキットOpenFaceを利用した。
論文 参考訳(メタデータ) (2021-11-29T20:11:57Z) - Few-Cost Salient Object Detection with Adversarial-Paced Learning [95.0220555274653]
本稿では,少数のトレーニング画像にのみ手動アノテーションを応用して,効果的なサルエント物体検出モデルを学習することを提案する。
我々は,このタスクを,少額の有能な物体検出とみなし,少数のコストの学習シナリオを促進するために,APL(Adversarialpaced Learning)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-05T14:15:49Z) - Video Summarization Using Deep Neural Networks: A Survey [72.98424352264904]
ビデオ要約技術は、ビデオコンテンツの最も有益な部分を選択して、簡潔で完全なシノプシスを作成することを目指しています。
本研究は,この領域における最近の進歩に着目し,既存の深層学習に基づく総括的映像要約手法の包括的調査を行う。
論文 参考訳(メタデータ) (2021-01-15T11:41:29Z) - Deep Learning for Road Traffic Forecasting: Does it Make a Difference? [6.220008946076208]
本稿では,このITS研究領域におけるDeep Learningの活用に言及した技術の現状を批判的に分析することに焦点を当てる。
後続の批判分析は、交通予測のためのディープラーニングの問題について、質問を定式化し、必要な議論を引き起こす。
論文 参考訳(メタデータ) (2020-12-02T15:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。