論文の概要: Intelligent Image Sensing for Crime Analysis: A ML Approach towards Enhanced Violence Detection and Investigation
- arxiv url: http://arxiv.org/abs/2506.13910v1
- Date: Mon, 16 Jun 2025 18:39:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.209059
- Title: Intelligent Image Sensing for Crime Analysis: A ML Approach towards Enhanced Violence Detection and Investigation
- Title(参考訳): 犯罪分析のためのインテリジェントイメージセンシング:暴力検出と捜査の強化に向けたMLアプローチ
- Authors: Aritra Dutta, Pushpita Boral, G Suseela,
- Abstract要約: 本稿では,暴力検出と分類のための包括的枠組みを導入し,二者・多階級の暴力分類にスーパーバイザード・ラーニングを適用した。
トレーニングは、フレームレベルのアノテーションを備えたさまざまなカスタマイズされたデータセット上で実施され、監視カメラ、人間の録画、ホッケーの試合、ソハ、さまざまなプラットフォームにわたるwvdデータセットのビデオが組み込まれている。
- 参考スコア(独自算出の注目度): 1.8219466405383231
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing global crime rate, coupled with substantial human and property losses, highlights the limitations of traditional surveillance methods in promptly detecting diverse and unexpected acts of violence. Addressing this pressing need for automatic violence detection, we leverage Machine Learning to detect and categorize violent events in video streams. This paper introduces a comprehensive framework for violence detection and classification, employing Supervised Learning for both binary and multi-class violence classification. The detection model relies on 3D Convolutional Neural Networks, while the classification model utilizes the separable convolutional 3D model for feature extraction and bidirectional LSTM for temporal processing. Training is conducted on a diverse customized datasets with frame-level annotations, incorporating videos from surveillance cameras, human recordings, hockey fight, sohas and wvd dataset across various platforms. Additionally, a camera module integrated with raspberry pi is used to capture live video feed, which is sent to the ML model for processing. Thus, demonstrating improved performance in terms of computational resource efficiency and accuracy.
- Abstract(参考訳): 世界的な犯罪率の増加と人的・財産的損失の増大は、多様な、予期せぬ暴力行為を迅速に検出する伝統的な監視方法の限界を浮き彫りにする。
自動暴力検出の必要性に対処するため、ビデオストリーム内の暴力イベントを検出し分類するために機械学習を活用します。
本稿では,暴力検出と分類のための包括的枠組みを導入し,二者・多階級の暴力分類にスーパーバイザード・ラーニングを適用した。
検出モデルは3次元畳み込みニューラルネットワークに依存し,分類モデルは特徴抽出に分離可能な畳み込み3Dモデル,時間処理に双方向LSTMを利用する。
トレーニングは、フレームレベルのアノテーションを備えたさまざまなカスタマイズされたデータセット上で実施され、監視カメラ、人間の録画、ホッケーの試合、ソハ、さまざまなプラットフォームにわたるwvdデータセットのビデオが組み込まれている。
さらに、Raspberry piと統合されたカメラモジュールを使用してライブビデオフィードをキャプチャし、処理のためにMLモデルに送信する。
このように、計算資源効率と精度の観点から、性能の向上を示す。
関連論文リスト
- A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本研究では,ガウスプレートの拡散モデルであるSplatDiffusionを導入し,単一画像から3次元構造を生成する。
既存の方法は決定論的フィードフォワード予測に依存しており、2Dデータからの3D推論の本質的な曖昧さを扱う能力を制限する。
論文 参考訳(メタデータ) (2024-12-01T00:29:57Z) - Streamlining Video Analysis for Efficient Violence Detection [1.444946491007292]
本稿では,監視カメラが捉えたビデオフレームにおける自動暴力検出の課題に対処する。
本稿では,3次元畳み込みニューラルネットワーク(3D CNN)に基づくモデルX3Dを用いてこの問題に対処する手法を提案する。
論文 参考訳(メタデータ) (2024-11-29T06:32:36Z) - Optimizing Violence Detection in Video Classification Accuracy through 3D Convolutional Neural Networks [0.0]
本研究は、暴力検出モデルの精度を最適化するために、一度に何つのフレームを分析すべきかを特定することである。
以前の暴力分類モデルが作成されているが、ライブ映像への応用には欠陥がある可能性がある。
最も高い検証精度は94.87%であり、同時に3つのフレームを分析したモデルで発生した。
論文 参考訳(メタデータ) (2024-11-02T19:29:01Z) - Two-stream Multi-dimensional Convolutional Network for Real-time
Violence Detection [0.0]
本研究は,2-stream Multi-dimensional Convolutional Network (2s-MDCN) と呼ばれる,暴力検出のための新しいアーキテクチャを提案する。
提案手法は1次元, 2次元, 3次元の畳み込みによって時間的, 空間的情報を独立に抽出する。
我々のモデルは、最大の暴力検出ベンチマークデータセットで89.7%の最先端の精度を得た。
論文 参考訳(メタデータ) (2022-11-08T14:04:47Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - SSMTL++: Revisiting Self-Supervised Multi-Task Learning for Video
Anomaly Detection [108.57862846523858]
自己教師型マルチタスク学習フレームワークを再考し、元の手法にいくつかのアップデートを提案する。
マルチヘッド・セルフアテンション・モジュールを導入することで3次元畳み込みバックボーンを近代化する。
モデルをさらに改良するために,セグメントマップの予測などの自己指導型学習タスクについて検討した。
論文 参考訳(メタデータ) (2022-07-16T19:25:41Z) - Real Time Action Recognition from Video Footage [0.5219568203653523]
ビデオ監視カメラは犯罪を検知する新しい次元を追加した。
本研究は、暴力行為を検出するための自律監視のための堅牢なパイプラインを確保するために、最先端のディープラーニング手法を統合することに焦点を当てる。
論文 参考訳(メタデータ) (2021-12-13T07:27:41Z) - Anomaly Recognition from surveillance videos using 3D Convolutional
Neural Networks [0.0]
異常なアクティビティ認識は、通常のストリームから変化するパターンやイベントを識別する。
この研究は、中央フロリダ大学犯罪ビデオデータセットに基づいて訓練された深部3次元畳み込みネットワーク(3D ConvNets)を用いて、特徴の学習にシンプルで効果的なアプローチを提供する。
論文 参考訳(メタデータ) (2021-01-04T16:32:48Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z) - Anomaly Detection in Video via Self-Supervised and Multi-Task Learning [113.81927544121625]
ビデオにおける異常検出は、コンピュータビジョンの問題である。
本稿では,オブジェクトレベルでの自己教師型およびマルチタスク学習を通じて,ビデオ中の異常事象検出にアプローチする。
論文 参考訳(メタデータ) (2020-11-15T10:21:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。