Fugu-MT 論文翻訳(概要): Analysis of Real-Time Hostile Activitiy Detection from Spatiotemporal Features Using Time Distributed Deep CNNs, RNNs and Attention-Based Mechanisms

論文の概要: Analysis of Real-Time Hostile Activitiy Detection from Spatiotemporal Features Using Time Distributed Deep CNNs, RNNs and Attention-Based Mechanisms

arxiv url: http://arxiv.org/abs/2302.11027v1
Date: Tue, 21 Feb 2023 22:02:39 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-23 17:04:23.918280
Title: Analysis of Real-Time Hostile Activitiy Detection from Spatiotemporal Features Using Time Distributed Deep CNNs, RNNs and Attention-Based Mechanisms
Title（参考訳）: 時間分散深部CNN, RNNおよび注意機構を用いた時空間特徴からのリアルタイム宿主活動検出の解析
Authors: Labib Ahmed Siddique, Rabita Junhai, Tanzim Reza, Salman Sayeed Khan, and Tanvir Rahman
Abstract要約: CCTVカメラシステムによるリアルタイムビデオ監視は、公共の安全を確保するために欠かせないものとなっている。ディープラーニングビデオ分類技術は、監視システムを自動化して暴力を検知するのに役立ちます。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Real-time video surveillance, through CCTV camera systems has become essential for ensuring public safety which is a priority today. Although CCTV cameras help a lot in increasing security, these systems require constant human interaction and monitoring. To eradicate this issue, intelligent surveillance systems can be built using deep learning video classification techniques that can help us automate surveillance systems to detect violence as it happens. In this research, we explore deep learning video classification techniques to detect violence as they are happening. Traditional image classification techniques fall short when it comes to classifying videos as they attempt to classify each frame separately for which the predictions start to flicker. Therefore, many researchers are coming up with video classification techniques that consider spatiotemporal features while classifying. However, deploying these deep learning models with methods such as skeleton points obtained through pose estimation and optical flow obtained through depth sensors, are not always practical in an IoT environment. Although these techniques ensure a higher accuracy score, they are computationally heavier. Keeping these constraints in mind, we experimented with various video classification and action recognition techniques such as ConvLSTM, LRCN (with both custom CNN layers and VGG-16 as feature extractor) CNNTransformer and C3D. We achieved a test accuracy of 80% on ConvLSTM, 83.33% on CNN-BiLSTM, 70% on VGG16-BiLstm ,76.76% on CNN-Transformer and 80% on C3D.
Abstract（参考訳）: CCTVカメラシステムによるリアルタイムビデオ監視は、今日の優先事項である公共の安全を確保するために欠かせないものとなっている。 cctvカメラはセキュリティの強化に大いに役立つが、これらのシステムは人間のインタラクションと監視を常に必要としている。この問題を根絶するために、インテリジェントな監視システムは、ディープラーニングのビデオ分類技術を使って構築することができる。本研究では,暴力の発生を検知する深層学習ビデオ分類手法について検討する。従来の画像分類技術では、各フレームを別々に分類しようとすると、ビデオの分類が短くなり、予測がフリックし始める。そのため,多くの研究者が,時空間的特徴を考慮した映像分類手法を考案している。しかし,これらの深層学習モデルを,ポーズ推定や奥行きセンサによる光学的流れによって得られる骨格点などの方法で展開することは,IoT環境では必ずしも現実的ではない。これらの手法は高い精度を保証するが、計算的に重くなっている。これらの制約を念頭に置いて, ConvLSTM, LRCN (カスタムCNN層と機能抽出器としてVGG-16) CNNTransformer, C3D など,様々なビデオ分類および行動認識技術の実験を行った。 CNN-BiLSTMは83.33%,VGG16-BiLstmは70%,CNN-Transformerは76.76%,C3Dは80%であった。

関連論文リスト

Real-Time Human Detection for Aerial Captured Video Sequences via Deep Models [1.4656201740804355]
光学的流れと3つの異なる深部モデルを組み合わせた自動特徴学習法を提案する。モデルは、公開され、非常に困難なUCF-ARG航空データセット上で訓練され、テストされる。実験の結果,提案手法は人体検出作業に有効であることが確認された。
論文参考訳（メタデータ） (2026-01-01T17:00:04Z)
Intelligent Image Sensing for Crime Analysis: A ML Approach towards Enhanced Violence Detection and Investigation [1.8219466405383231]
本稿では,暴力検出と分類のための包括的枠組みを導入し,二者・多階級の暴力分類にスーパーバイザード・ラーニングを適用した。トレーニングは、フレームレベルのアノテーションを備えたさまざまなカスタマイズされたデータセット上で実施され、監視カメラ、人間の録画、ホッケーの試合、ソハ、さまざまなプラットフォームにわたるwvdデータセットのビデオが組み込まれている。
論文参考訳（メタデータ） (2025-06-16T18:39:16Z)
Deepfake Detection with Spatio-Temporal Consistency and Attention [46.1135899490656]
ディープフェイクビデオは、現実主義の高まりにより、コミュニティの間で懸念が高まっている。鍛造ビデオ検出の現在の方法は、主にグローバルなフレーム機能に依存している。本稿では,偽ビデオの局所的な操作的シグネチャに着目したニューラルディープフェイク検出器を提案する。
論文参考訳（メタデータ） (2025-02-12T08:51:33Z)
Real-Time Anomaly Detection in Video Streams [0.0]
この論文は、Othello社とIASD研究所との間のCIFRE協定の一部である。目的は、ビデオストリーム内のリアルタイムな危険を検出する人工知能システムを開発することである。
論文参考訳（メタデータ） (2024-11-29T14:24:33Z)
CCTV-Gun: Benchmarking Handgun Detection in CCTV Images [59.24281591714385]
銃の暴力は重要なセキュリティ問題であり、コンピュータビジョンコミュニティが効果的な銃検出アルゴリズムを開発することが必須である。実際のCCTV画像から銃を検出することは、未だに困難で未調査の課題である。我々は,実世界のCCTV画像における拳銃検出の課題に対処するベンチマーク「textbfCCTV-Gun」を提案する。
論文参考訳（メタデータ） (2023-03-19T16:17:35Z)
Detecting train driveshaft damages using accelerometer signals and Differential Convolutional Neural Networks [67.60224656603823]
本稿では,高度2次元畳み込みニューラルネットワーク(CNN)アーキテクチャに基づく鉄道軸状態監視システムの開発を提案する。その結果,鉄道軸受振動信号を時間周波数領域表現,すなわち分光図に変換し,そのひび割れに応じて2次元CNNを訓練する。
論文参考訳（メタデータ） (2022-11-15T15:04:06Z)
Intelligent 3D Network Protocol for Multimedia Data Classification using Deep Learning [0.0]
我々はSTIPと3D CNNの機能を組み合わせたハイブリッドディープラーニングアーキテクチャを実装し、3Dビデオのパフォーマンスを効果的に向上させる。その結果,UCF101の動作認識のための文献から得られた最新のフレームワークを95%の精度で比較した。
論文参考訳（メタデータ） (2022-07-23T12:24:52Z)
Real Time Action Recognition from Video Footage [0.5219568203653523]
ビデオ監視カメラは犯罪を検知する新しい次元を追加した。本研究は、暴力行為を検出するための自律監視のための堅牢なパイプラインを確保するために、最先端のディープラーニング手法を統合することに焦点を当てる。
論文参考訳（メタデータ） (2021-12-13T07:27:41Z)
Video Salient Object Detection via Contrastive Features and Attention Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文参考訳（メタデータ） (2021-11-03T17:40:32Z)
Event and Activity Recognition in Video Surveillance for Cyber-Physical Systems [0.0]
長期動作パターンは、イベントを認識するタスクにおいて、それ自体が重要な役割を果たす。本研究では,イベント認識作業において,長期動作パターンのみが重要な役割を担っていることを示す。時間的特徴のみをハイブリッド畳み込みニューラルネットワーク(CNN)+リカレントニューラルネットワーク(RNN)アーキテクチャで活用する。
論文参考訳（メタデータ） (2021-11-03T08:30:38Z)
Spatiotemporal Inconsistency Learning for DeepFake Video Detection [51.747219106855624]
本稿では,水平方向と垂直方向の両方で隣接するフレーム間の時間差を利用して,TIMにおける新しい時間的モデリングパラダイムを提案する。 ISMは、SIMからの空間情報とTIMからの時間情報とを同時に利用し、より包括的な時空間表現を確立する。
論文参考訳（メタデータ） (2021-09-04T13:05:37Z)
Adversarially robust deepfake media detection using fused convolutional neural network predictions [79.00202519223662]
現在のディープフェイク検出システムは、目に見えないデータと戦っている。ビデオから抽出した偽画像と実画像の分類には,CNN(Deep Convolutional Neural Network)モデルが3種類採用されている。提案手法は96.5%の精度で最先端のモデルより優れている。
論文参考訳（メタデータ） (2021-02-11T11:28:00Z)
Training Strategies and Data Augmentations in CNN-based DeepFake Video Detection [17.696134665850447]
ビデオにおける顔偽造検出のための自動システムの精度は依然として非常に限られており、特定の検知システムの設計と訓練に使用されるデータセットに偏っている。本稿では、異なるトレーニング戦略とデータ拡張技術が、同じデータセット上でトレーニングやテストを行う場合、あるいは異なるデータセット間で、CNNベースのディープフェイク検出器にどのように影響するかを分析する。
論文参考訳（メタデータ） (2020-11-16T08:50:56Z)
A Real-time Action Representation with Temporal Encoding and Deep Compression [115.3739774920845]
動作表現のための時間畳み込み3Dネットワーク(T-C3D)と呼ばれる新しいリアルタイム畳み込みアーキテクチャを提案する。 T-C3Dは、高プロセス速度を得ながら、階層的な多粒度でビデオアクション表現を学習する。提案手法は,5MB未満のストレージモデルを用いて,提案手法の精度5.4%,推論速度2倍の高速化を実現した。
論文参考訳（メタデータ） (2020-06-17T06:30:43Z)
An Information-rich Sampling Technique over Spatio-Temporal CNN for Classification of Human Actions in Videos [5.414308305392762]
本稿では,3次元畳み込みニューラルネットワーク(3D CNN)を用いたビデオにおける人間の行動認識手法を提案する。本稿では,3次元CNNアーキテクチャを用いて特徴量抽出を行い,人間の行動を認識するためのLong Short-Term Memory (LSTM) について述べる。 KTHとWEIZMANNの人間の行動データセットを用いて実験を行い、最先端技術と同等の結果が得られることを示した。
論文参考訳（メタデータ） (2020-02-06T05:07:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。