論文の概要: A Computer Vision Based Approach for Stalking Detection Using a
CNN-LSTM-MLP Hybrid Fusion Model
- arxiv url: http://arxiv.org/abs/2402.03417v1
- Date: Mon, 5 Feb 2024 18:53:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 18:39:05.011910
- Title: A Computer Vision Based Approach for Stalking Detection Using a
CNN-LSTM-MLP Hybrid Fusion Model
- Title(参考訳): CNN-LSTM-MLPハイブリッド核融合モデルを用いたコンピュータビジョンによるストーキング検出
- Authors: Murad Hasan, Shahriar Iqbal, Md. Billal Hossain Faisal, Md. Musnad
Hossin Neloy, Md. Tonmoy Kabir, Md. Tanzim Reza, Md. Golam Rabiul Alam, Md
Zia Uddin
- Abstract要約: 公共の場所でのストーキングは、女性が最も影響を受けているため、一般的な出来事となっている。
これらの犯罪行為はすべてストーキング検出によって止められるため、ストーキングを検出する必要性が高まっている。
本研究では,1つのビデオから潜在的ストーカーを検出するための,ディープラーニングに基づくハイブリッドフュージョンモデルを提案する。
- 参考スコア(独自算出の注目度): 1.0691590188849427
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Criminal and suspicious activity detection has become a popular research
topic in recent years. The rapid growth of computer vision technologies has had
a crucial impact on solving this issue. However, physical stalking detection is
still a less explored area despite the evolution of modern technology.
Nowadays, stalking in public places has become a common occurrence with women
being the most affected. Stalking is a visible action that usually occurs
before any criminal activity begins as the stalker begins to follow, loiter,
and stare at the victim before committing any criminal activity such as
assault, kidnapping, rape, and so on. Therefore, it has become a necessity to
detect stalking as all of these criminal activities can be stopped in the first
place through stalking detection. In this research, we propose a novel deep
learning-based hybrid fusion model to detect potential stalkers from a single
video with a minimal number of frames. We extract multiple relevant features,
such as facial landmarks, head pose estimation, and relative distance, as
numerical values from video frames. This data is fed into a multilayer
perceptron (MLP) to perform a classification task between a stalking and a
non-stalking scenario. Simultaneously, the video frames are fed into a
combination of convolutional and LSTM models to extract the spatio-temporal
features. We use a fusion of these numerical and spatio-temporal features to
build a classifier to detect stalking incidents. Additionally, we introduce a
dataset consisting of stalking and non-stalking videos gathered from various
feature films and television series, which is also used to train the model. The
experimental results show the efficiency and dynamism of our proposed stalker
detection system, achieving 89.58% testing accuracy with a significant
improvement as compared to the state-of-the-art approaches.
- Abstract(参考訳): 近年,犯罪や不審な活動の検出が研究の話題となっている。
コンピュータビジョン技術の急速な成長は、この問題の解決に大きな影響を与えた。
しかし、現代の技術の進化にもかかわらず、物理的ストーキング検出はいまだ探索の少ない領域である。
今日では、公共の場所でストーカーがよく行われ、女性が最も影響を受けている。
ストーキング(ストーキング、英: stalking)は、通常、ストーカーが暴行、誘拐、強姦などの犯罪行為を行う前に、被害者を追跡し、横行し、凝視し始めると、犯罪行為が始まる前に発生する目に見える行為である。
そのため,ストーキング検出により,これらの犯罪行為をすべて防止できるため,ストーキング検出の必要性が高まっている。
本研究では,最小限のフレーム数で単一のビデオから潜在的ストーカーを検出するための,ディープラーニングに基づくハイブリッド融合モデルを提案する。
ビデオフレームから顔ランドマーク,頭部ポーズ推定,相対距離といった複数の関連特徴を数値として抽出する。
このデータは多層パーセプトロン(MLP)に入力され、ストーキングと非ストーキングシナリオの分類タスクを実行する。
同時に、ビデオフレームは畳み込みモデルとLSTMモデルの組み合わせに入力され、時空間の特徴を抽出する。
我々はこれらの数値的特徴と時空間的特徴を融合して、ストーキング事件を検出する分類器を構築する。
また,様々な特徴映画やテレビシリーズから収集したストーキング映像と非ストーキング映像からなるデータセットを導入し,モデルを訓練する。
実験結果は,提案するストーカー検出システムの効率とダイナミズムを示し,最新手法と比較して89.58%の精度を達成し,大幅に改善した。
関連論文リスト
- Model Inversion Attacks: A Survey of Approaches and Countermeasures [59.986922963781]
近年、新しいタイプのプライバシ攻撃であるモデル反転攻撃(MIA)は、トレーニングのためのプライベートデータの機密性を抽出することを目的としている。
この重要性にもかかわらず、総合的な概要とMIAに関する深い洞察を提供する体系的な研究が欠如している。
本調査は、攻撃と防御の両方において、最新のMIA手法を要約することを目的としている。
論文 参考訳(メタデータ) (2024-11-15T08:09:28Z) - JOSENet: A Joint Stream Embedding Network for Violence Detection in Surveillance Videos [4.94659999696881]
監視ビデオにおける暴力検出は、様々な実戦シーンのような追加の問題を提示する。
本稿では、監視ビデオにおける暴力検出に優れたパフォーマンスを提供する自己監視フレームワークJOSENetを紹介する。
論文 参考訳(メタデータ) (2024-05-05T15:01:00Z) - Tracking by Associating Clips [110.08925274049409]
本稿では,オブジェクト関連をクリップワイドマッチングとして扱う方法を検討する。
我々の新しい視点では、1つの長いビデオシーケンスを複数のショートクリップとみなし、そのトラックはクリップ内とクリップ間の両方で実行される。
この新しい手法の利点は2つある。まず、ビデオチャンキングによって中断フレームをバイパスできるため、エラーの蓄積や伝播の追跡に頑健である。
次に、クリップワイドマッチング中に複数のフレーム情報を集約し、現在のフレームワイドマッチングよりも高精度な長距離トラックアソシエーションを実現する。
論文 参考訳(メタデータ) (2022-12-20T10:33:17Z) - Video Action Detection: Analysing Limitations and Challenges [70.01260415234127]
ビデオ行動検出における既存のデータセットを分析し,その限界について議論する。
静的画像から映像を区別する重要な特性である時間的側面を解析するバイアスネススタディを実行する。
このような極端な実験は、注意深いモデリングを必要とする既存の手法に忍び込んだバイアスの存在を示している。
論文 参考訳(メタデータ) (2022-04-17T00:42:14Z) - Real Time Action Recognition from Video Footage [0.5219568203653523]
ビデオ監視カメラは犯罪を検知する新しい次元を追加した。
本研究は、暴力行為を検出するための自律監視のための堅牢なパイプラインを確保するために、最先端のディープラーニング手法を統合することに焦点を当てる。
論文 参考訳(メタデータ) (2021-12-13T07:27:41Z) - DEFT: Detection Embeddings for Tracking [3.326320568999945]
我々は,DEFT と呼ばれる効率的な関節検出・追跡モデルを提案する。
提案手法は,外見に基づくオブジェクトマッチングネットワークと,下層のオブジェクト検出ネットワークとの協調学習に依存している。
DEFTは2Dオンライントラッキングリーダーボードのトップメソッドに匹敵する精度とスピードを持っている。
論文 参考訳(メタデータ) (2021-02-03T20:00:44Z) - Detecting Invisible People [58.49425715635312]
我々は,追跡ベンチマークを再利用し,目立たない物体を検出するための新しい指標を提案する。
私たちは、現在の検出および追跡システムがこのタスクで劇的に悪化することを実証します。
第2に,最先端の単眼深度推定ネットワークによる観測結果を用いて,3次元で明示的に推論する動的モデルを構築した。
論文 参考訳(メタデータ) (2020-12-15T16:54:45Z) - TubeTK: Adopting Tubes to Track Multi-Object in a One-Step Training
Model [51.14840210957289]
マルチオブジェクトトラッキングは、長い間研究されてきた基本的な視覚問題である。
Tracking by Detection (TBD)の成功にもかかわらず、この2段階の手法はエンドツーエンドでトレーニングするには複雑すぎる。
本稿では,短いビデオクリップ中の物体の時間空間位置を示すために,バウンディングチューブを導入することで,一段階のトレーニングしか必要としない簡潔なエンドツーエンドモデルチューブTKを提案する。
論文 参考訳(メタデータ) (2020-06-10T06:45:05Z) - Gabriella: An Online System for Real-Time Activity Detection in
Untrimmed Security Videos [72.50607929306058]
本研究では,未トリミングされたセキュリティビデオ上でのアクティビティ検出をリアルタイムに行うオンラインシステムを提案する。
提案手法は, チューブレット抽出, 活性分類, オンラインチューブレットマージの3段階からなる。
提案手法の有効性を,100fps(100fps)と最新技術による性能評価で実証した。
論文 参考訳(メタデータ) (2020-04-23T22:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。