論文の概要: Analysis of Real-Time Hostile Activitiy Detection from Spatiotemporal
Features Using Time Distributed Deep CNNs, RNNs and Attention-Based
Mechanisms
- arxiv url: http://arxiv.org/abs/2302.11027v1
- Date: Tue, 21 Feb 2023 22:02:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-23 17:04:23.918280
- Title: Analysis of Real-Time Hostile Activitiy Detection from Spatiotemporal
Features Using Time Distributed Deep CNNs, RNNs and Attention-Based
Mechanisms
- Title(参考訳): 時間分散深部CNN, RNNおよび注意機構を用いた時空間特徴からのリアルタイム宿主活動検出の解析
- Authors: Labib Ahmed Siddique, Rabita Junhai, Tanzim Reza, Salman Sayeed Khan,
and Tanvir Rahman
- Abstract要約: CCTVカメラシステムによるリアルタイムビデオ監視は、公共の安全を確保するために欠かせないものとなっている。
ディープラーニングビデオ分類技術は、監視システムを自動化して暴力を検知するのに役立ちます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-time video surveillance, through CCTV camera systems has become
essential for ensuring public safety which is a priority today. Although CCTV
cameras help a lot in increasing security, these systems require constant human
interaction and monitoring. To eradicate this issue, intelligent surveillance
systems can be built using deep learning video classification techniques that
can help us automate surveillance systems to detect violence as it happens. In
this research, we explore deep learning video classification techniques to
detect violence as they are happening. Traditional image classification
techniques fall short when it comes to classifying videos as they attempt to
classify each frame separately for which the predictions start to flicker.
Therefore, many researchers are coming up with video classification techniques
that consider spatiotemporal features while classifying. However, deploying
these deep learning models with methods such as skeleton points obtained
through pose estimation and optical flow obtained through depth sensors, are
not always practical in an IoT environment. Although these techniques ensure a
higher accuracy score, they are computationally heavier. Keeping these
constraints in mind, we experimented with various video classification and
action recognition techniques such as ConvLSTM, LRCN (with both custom CNN
layers and VGG-16 as feature extractor) CNNTransformer and C3D. We achieved a
test accuracy of 80% on ConvLSTM, 83.33% on CNN-BiLSTM, 70% on VGG16-BiLstm
,76.76% on CNN-Transformer and 80% on C3D.
- Abstract(参考訳): CCTVカメラシステムによるリアルタイムビデオ監視は、今日の優先事項である公共の安全を確保するために欠かせないものとなっている。
cctvカメラはセキュリティの強化に大いに役立つが、これらのシステムは人間のインタラクションと監視を常に必要としている。
この問題を根絶するために、インテリジェントな監視システムは、ディープラーニングのビデオ分類技術を使って構築することができる。
本研究では,暴力の発生を検知する深層学習ビデオ分類手法について検討する。
従来の画像分類技術では、各フレームを別々に分類しようとすると、ビデオの分類が短くなり、予測がフリックし始める。
そのため,多くの研究者が,時空間的特徴を考慮した映像分類手法を考案している。
しかし,これらの深層学習モデルを,ポーズ推定や奥行きセンサによる光学的流れによって得られる骨格点などの方法で展開することは,IoT環境では必ずしも現実的ではない。
これらの手法は高い精度を保証するが、計算的に重くなっている。
これらの制約を念頭に置いて, ConvLSTM, LRCN (カスタムCNN層と機能抽出器としてVGG-16) CNNTransformer, C3D など,様々なビデオ分類および行動認識技術の実験を行った。
CNN-BiLSTMは83.33%,VGG16-BiLstmは70%,CNN-Transformerは76.76%,C3Dは80%であった。
関連論文リスト
- Deepfake Detection with Spatio-Temporal Consistency and Attention [46.1135899490656]
ディープフェイクビデオは、現実主義の高まりにより、コミュニティの間で懸念が高まっている。
鍛造ビデオ検出の現在の方法は、主にグローバルなフレーム機能に依存している。
本稿では,偽ビデオの局所的な操作的シグネチャに着目したニューラルディープフェイク検出器を提案する。
論文 参考訳(メタデータ) (2025-02-12T08:51:33Z) - Real-Time Anomaly Detection in Video Streams [0.0]
この論文は、Othello社とIASD研究所との間のCIFRE協定の一部である。
目的は、ビデオストリーム内のリアルタイムな危険を検出する人工知能システムを開発することである。
論文 参考訳(メタデータ) (2024-11-29T14:24:33Z) - CCTV-Gun: Benchmarking Handgun Detection in CCTV Images [59.24281591714385]
銃の暴力は重要なセキュリティ問題であり、コンピュータビジョンコミュニティが効果的な銃検出アルゴリズムを開発することが必須である。
実際のCCTV画像から銃を検出することは、未だに困難で未調査の課題である。
我々は,実世界のCCTV画像における拳銃検出の課題に対処するベンチマーク「textbfCCTV-Gun」を提案する。
論文 参考訳(メタデータ) (2023-03-19T16:17:35Z) - Detecting train driveshaft damages using accelerometer signals and
Differential Convolutional Neural Networks [67.60224656603823]
本稿では,高度2次元畳み込みニューラルネットワーク(CNN)アーキテクチャに基づく鉄道軸状態監視システムの開発を提案する。
その結果,鉄道軸受振動信号を時間周波数領域表現,すなわち分光図に変換し,そのひび割れに応じて2次元CNNを訓練する。
論文 参考訳(メタデータ) (2022-11-15T15:04:06Z) - Real Time Action Recognition from Video Footage [0.5219568203653523]
ビデオ監視カメラは犯罪を検知する新しい次元を追加した。
本研究は、暴力行為を検出するための自律監視のための堅牢なパイプラインを確保するために、最先端のディープラーニング手法を統合することに焦点を当てる。
論文 参考訳(メタデータ) (2021-12-13T07:27:41Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - Event and Activity Recognition in Video Surveillance for Cyber-Physical
Systems [0.0]
長期動作パターンは、イベントを認識するタスクにおいて、それ自体が重要な役割を果たす。
本研究では,イベント認識作業において,長期動作パターンのみが重要な役割を担っていることを示す。
時間的特徴のみをハイブリッド畳み込みニューラルネットワーク(CNN)+リカレントニューラルネットワーク(RNN)アーキテクチャで活用する。
論文 参考訳(メタデータ) (2021-11-03T08:30:38Z) - Adversarially robust deepfake media detection using fused convolutional
neural network predictions [79.00202519223662]
現在のディープフェイク検出システムは、目に見えないデータと戦っている。
ビデオから抽出した偽画像と実画像の分類には,CNN(Deep Convolutional Neural Network)モデルが3種類採用されている。
提案手法は96.5%の精度で最先端のモデルより優れている。
論文 参考訳(メタデータ) (2021-02-11T11:28:00Z) - Training Strategies and Data Augmentations in CNN-based DeepFake Video
Detection [17.696134665850447]
ビデオにおける顔偽造検出のための自動システムの精度は依然として非常に限られており、特定の検知システムの設計と訓練に使用されるデータセットに偏っている。
本稿では、異なるトレーニング戦略とデータ拡張技術が、同じデータセット上でトレーニングやテストを行う場合、あるいは異なるデータセット間で、CNNベースのディープフェイク検出器にどのように影響するかを分析する。
論文 参考訳(メタデータ) (2020-11-16T08:50:56Z) - A Real-time Action Representation with Temporal Encoding and Deep
Compression [115.3739774920845]
動作表現のための時間畳み込み3Dネットワーク(T-C3D)と呼ばれる新しいリアルタイム畳み込みアーキテクチャを提案する。
T-C3Dは、高プロセス速度を得ながら、階層的な多粒度でビデオアクション表現を学習する。
提案手法は,5MB未満のストレージモデルを用いて,提案手法の精度5.4%,推論速度2倍の高速化を実現した。
論文 参考訳(メタデータ) (2020-06-17T06:30:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。