論文の概要: Accurate and Efficient Two-Stage Gun Detection in Video
- arxiv url: http://arxiv.org/abs/2503.06317v1
- Date: Sat, 08 Mar 2025 19:26:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:49:03.735331
- Title: Accurate and Efficient Two-Stage Gun Detection in Video
- Title(参考訳): ビデオにおける高精度かつ効率的な2段階銃検出
- Authors: Badhan Chandra Das, M. Hadi Amini, Yanzhao Wu,
- Abstract要約: 本稿では,新しい2段式銃検出法を提案する。
ステージ1では,ガンの映像を効果的に分類するために,画像拡張モデルを訓練する。
ステージ2では、映像フレーム内の銃の正確な領域を特定するためにオブジェクト検出モデルを用いており、ステージ1では「ガン」に分類されている。
- 参考スコア(独自算出の注目度): 2.6986500640871482
- License:
- Abstract: Object detection in videos plays a crucial role in advancing applications such as public safety and anomaly detection. Existing methods have explored different techniques, including CNN, deep learning, and Transformers, for object detection and video classification. However, detecting tiny objects, e.g., guns, in videos remains challenging due to their small scale and varying appearances in complex scenes. Moreover, existing video analysis models for classification or detection often perform poorly in real-world gun detection scenarios due to limited labeled video datasets for training. Thus, developing efficient methods for effectively capturing tiny object features and designing models capable of accurate gun detection in real-world videos is imperative. To address these challenges, we make three original contributions in this paper. First, we conduct an empirical study of several existing video classification and object detection methods to identify guns in videos. Our extensive analysis shows that these methods may not accurately detect guns in videos. Second, we propose a novel two-stage gun detection method. In stage 1, we train an image-augmented model to effectively classify ``Gun'' videos. To make the detection more precise and efficient, stage 2 employs an object detection model to locate the exact region of the gun within video frames for videos classified as ``Gun'' by stage 1. Third, our experimental results demonstrate that the proposed domain-specific method achieves significant performance improvements and enhances efficiency compared with existing techniques. We also discuss challenges and future research directions in gun detection tasks in computer vision.
- Abstract(参考訳): ビデオにおけるオブジェクト検出は、公共の安全や異常検出などの応用を進める上で重要な役割を果たす。
既存の手法では、オブジェクト検出とビデオ分類のためのCNN、ディープラーニング、トランスフォーマーなど、さまざまな手法が検討されている。
しかし、ビデオ中の小さな物体、例えば銃、などの検出は、その小さなスケールと複雑なシーンでの様々な外観のため、依然として困難である。
さらに、分類や検出のための既存のビデオ分析モデルは、訓練用のラベル付きビデオデータセットに制限があるため、実世界の銃検出シナリオでは不十分であることが多い。
したがって, 現実の映像において, 小さな物体の特徴を効果的に捉え, 正確な銃検出が可能なモデルを設計するための効率的な手法の開発が不可欠である。
これらの課題に対処するため,本稿では3つのオリジナルコントリビューションを行う。
まず,映像中の銃の識別のために,既存の映像分類法と物体検出法を実証的に検討した。
広範に分析したところ、これらの手法はビデオ中の銃の正確な検出には至らなかった。
次に,新しい2段式銃検出法を提案する。
ステージ1では、 ` `Gun'' ビデオを効果的に分類するために、画像拡張モデルを訓練する。
検出をより正確かつ効率的にするために、ステージ2では、ステージ1で「ガン」と分類されたビデオに対して、ビデオフレーム内の銃の正確な領域を特定するためにオブジェクト検出モデルを採用している。
第3に,提案手法は既存手法と比較して性能が向上し,効率が向上することを示す。
コンピュータビジョンにおける銃検出タスクにおける課題と今後の研究方向性についても論じる。
関連論文リスト
- CCTV-Gun: Benchmarking Handgun Detection in CCTV Images [59.24281591714385]
銃の暴力は重要なセキュリティ問題であり、コンピュータビジョンコミュニティが効果的な銃検出アルゴリズムを開発することが必須である。
実際のCCTV画像から銃を検出することは、未だに困難で未調査の課題である。
我々は,実世界のCCTV画像における拳銃検出の課題に対処するベンチマーク「textbfCCTV-Gun」を提案する。
論文 参考訳(メタデータ) (2023-03-19T16:17:35Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - Weakly Supervised Two-Stage Training Scheme for Deep Video Fight
Detection Model [0.0]
ビデオにおけるファイト検出は、今日の監視システムとストリーミングメディアの普及にともなう、新たなディープラーニングアプリケーションである。
これまでの研究は、この問題に対処するための行動認識技術に大きく依存していた。
本研究では,動作認識特徴抽出器と異常スコア生成器の合成として,戦闘検出モデルを設計する。
論文 参考訳(メタデータ) (2022-09-23T08:29:16Z) - Detection of Fights in Videos: A Comparison Study of Anomaly Detection
and Action Recognition [3.8073142980733]
本稿では,ビデオ中のケンカの検出を,異常検出の特殊なタイプとして,また2値のアクション認識として検討する。
異常検出は,動作認識と同等あるいはそれ以上の性能を有することがわかった。
実験結果から,3つの戦闘検出データセットの最先端性能が得られた。
論文 参考訳(メタデータ) (2022-05-23T15:41:02Z) - Few-Shot Learning for Video Object Detection in a Transfer-Learning
Scheme [70.45901040613015]
ビデオ物体検出のための数発学習の新たな課題について検討する。
我々は,多数のベースクラスオブジェクトに対して映像物体検出を効果的に訓練するトランスファー学習フレームワークと,ノベルクラスオブジェクトのいくつかのビデオクリップを用いる。
論文 参考訳(メタデータ) (2021-03-26T20:37:55Z) - Enhanced Few-shot Learning for Intrusion Detection in Railway Video
Surveillance [16.220077781635748]
拡張モデル非依存メタラーナーは、オリジナルビデオフレームと、ビデオから抽出されたトラック領域のセグメンテッドマスクの両方を用いて訓練される。
解析結果から,拡張メタラーナーは,新たに収集したビデオフレームのサンプルをわずかに残さず,見知らぬシーンに適応できることが示唆された。
論文 参考訳(メタデータ) (2020-11-09T08:59:15Z) - RSPNet: Relative Speed Perception for Unsupervised Video Representation
Learning [100.76672109782815]
本研究では,未ラベル映像のみから動作特徴と外観特徴の両方を学習するための教師なし映像表現学習について検討する。
動作と外観の両方をうまくモデル化するために、適切な自己指導タスクを構築することは困難である。
再生速度を知覚し、2つのビデオクリップ間の相対速度をラベルとして利用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-27T16:42:50Z) - VideoForensicsHQ: Detecting High-quality Manipulated Face Videos [77.60295082172098]
偽造検知器の性能は、人間の目で見られる人工物の存在にどのように依存するかを示す。
前例のない品質の顔ビデオ偽造検出のための新しいベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2020-05-20T21:17:43Z) - Gabriella: An Online System for Real-Time Activity Detection in
Untrimmed Security Videos [72.50607929306058]
本研究では,未トリミングされたセキュリティビデオ上でのアクティビティ検出をリアルタイムに行うオンラインシステムを提案する。
提案手法は, チューブレット抽出, 活性分類, オンラインチューブレットマージの3段階からなる。
提案手法の有効性を,100fps(100fps)と最新技術による性能評価で実証した。
論文 参考訳(メタデータ) (2020-04-23T22:20:10Z) - Sound of Guns: Digital Forensics of Gun Audio Samples meets Artificial
Intelligence [0.7734726150561086]
本稿では,マイクロホンとシューターの相対的な位置を全く意識せず,記録装置の知識をゼロにする新しい手法を提案する。
われわれのソリューションは、銃のカテゴリ、口径、モデルを特定し、3655サンプルからなるデータセット上で90%以上の精度に達する。
論文 参考訳(メタデータ) (2020-04-15T09:12:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。