論文の概要: Sound of Guns: Digital Forensics of Gun Audio Samples meets Artificial
Intelligence
- arxiv url: http://arxiv.org/abs/2004.07948v2
- Date: Mon, 1 Mar 2021 14:01:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 04:32:42.536434
- Title: Sound of Guns: Digital Forensics of Gun Audio Samples meets Artificial
Intelligence
- Title(参考訳): 銃の音: 銃のオーディオサンプルのデジタル鑑定が人工知能と出会う
- Authors: Simone Raponi, Isra Ali, Gabriele Oligeri
- Abstract要約: 本稿では,マイクロホンとシューターの相対的な位置を全く意識せず,記録装置の知識をゼロにする新しい手法を提案する。
われわれのソリューションは、銃のカテゴリ、口径、モデルを特定し、3655サンプルからなるデータセット上で90%以上の精度に達する。
- 参考スコア(独自算出の注目度): 0.7734726150561086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classifying a weapon based on its muzzle blast is a challenging task that has
significant applications in various security and military fields. Most of the
existing works rely on ad-hoc deployment of spatially diverse microphone
sensors to capture multiple replicas of the same gunshot, which enables
accurate detection and identification of the acoustic source. However,
carefully controlled setups are difficult to obtain in scenarios such as crime
scene forensics, making the aforementioned techniques inapplicable and
impractical. We introduce a novel technique that requires zero knowledge about
the recording setup and is completely agnostic to the relative positions of
both the microphone and shooter. Our solution can identify the category,
caliber, and model of the gun, reaching over 90% accuracy on a dataset composed
of 3655 samples that are extracted from YouTube videos. Our results demonstrate
the effectiveness and efficiency of applying Convolutional Neural Network (CNN)
in gunshot classification eliminating the need for an ad-hoc setup while
significantly improving the classification performance.
- Abstract(参考訳): 銃口の爆発に基づく武器の分類は、様々な安全保障や軍事分野に重要な応用をもたらす難しい課題である。
既存の研究の多くは、同じ銃弾の複数のレプリカを捉えるために、空間的に多様なマイクロフォンセンサーのアドホックな展開に依存しており、音響源の正確な検出と同定を可能にしている。
しかし、犯罪現場鑑定などのシナリオでは、慎重に制御された設定は入手が困難であり、前述の手法は適用不可能で実用的ではない。
本稿では,マイクロホンとシューターの相対的な位置を全く意識せず,記録装置の知識をゼロにする新しい手法を提案する。
われわれのソリューションは、YouTubeビデオから抽出された3655サンプルからなるデータセットで90%以上の精度で、銃のカテゴリ、口径、モデルを特定することができる。
本研究は,畳み込みニューラルネットワーク(cnn)をショット分類に適用することにより,アドホック設定の必要性をなくし,分類性能を大幅に向上させる効果と効率を示す。
関連論文リスト
- Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models [52.04189118767758]
一般化は、現在のオーディオディープフェイク検出器の主な問題である。
本稿では,オーディオディープフェイク検出のための大規模事前学習モデルの可能性について検討する。
論文 参考訳(メタデータ) (2024-05-03T15:27:11Z) - Proactive Detection of Voice Cloning with Localized Watermarking [50.13539630769929]
本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。
AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。
AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-30T18:56:22Z) - Novel Deep Learning Pipeline for Automatic Weapon Detection [0.0]
武器と銃の暴力は、最近、圧力のかかる問題になっている。
リアルタイム監視ビデオは、ほぼすべての公開フォーラムや場所で撮影、録画される。
本稿では,異なるアーキテクチャを持つ畳み込みニューラルネットワークのアンサンブルからなる,新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2023-09-28T17:55:14Z) - LoRA-like Calibration for Multimodal Deception Detection using ATSFace
Data [1.550120821358415]
本稿では,ビデオデータや誤認識のダイナミクスに固有の課題に対処する,注意を意識したニューラルネットワークを提案する。
我々は、精度を高めるマルチモーダル融合戦略を採用し、実生活の試行データセット上で92%の精度で精度を向上する。
論文 参考訳(メタデータ) (2023-09-04T06:22:25Z) - CCTV-Gun: Benchmarking Handgun Detection in CCTV Images [59.24281591714385]
銃の暴力は重要なセキュリティ問題であり、コンピュータビジョンコミュニティが効果的な銃検出アルゴリズムを開発することが必須である。
実際のCCTV画像から銃を検出することは、未だに困難で未調査の課題である。
我々は,実世界のCCTV画像における拳銃検出の課題に対処するベンチマーク「textbfCCTV-Gun」を提案する。
論文 参考訳(メタデータ) (2023-03-19T16:17:35Z) - Enemy Spotted: in-game gun sound dataset for gunshot classification and
localization [27.554240980052025]
ガンサウンドは、現実世界の戦闘を模倣するように設計されたFPSゲームから得ることができる。
BGGデータセットは37種類の銃器、距離、音源と受信機の間の方向で構成されている。
実世界の銃器分類と位置決め作業の精度は,BGGデータセットを用いて向上できることを示す。
論文 参考訳(メタデータ) (2022-10-12T04:36:56Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Audio-Visual Person-of-Interest DeepFake Detection [77.04789677645682]
本研究の目的は、現実世界で遭遇する様々な操作方法やシナリオに対処できるディープフェイク検出器を提案することである。
我々は、対照的な学習パラダイムを活用して、各アイデンティティに対して最も識別しやすい、移動面と音声セグメントの埋め込みを学習する。
本手法は,シングルモダリティ(オーディオのみ,ビデオのみ)とマルチモダリティ(オーディオビデオ)の両方を検出でき,低品質・低画質ビデオに対して堅牢である。
論文 参考訳(メタデータ) (2022-04-06T20:51:40Z) - YouTube-GDD: A challenging gun detection dataset with rich contextual
information [5.956046069509441]
この研究は、YouTube Gun Detection dataset(YouTube-GDD)と呼ばれる新しい挑戦的なデータセットを提示している。
私たちのデータセットは、343の高精細度YouTubeビデオから収集され、5,000の精巧な画像が含まれており、そのうち16064の銃と9046の人が注釈付けされている。
銃検出のためのベースラインを構築するために,YouTube-GDD上でYOLOv5を評価し,関連する注釈情報の追加が銃検出に与える影響を解析した。
論文 参考訳(メタデータ) (2022-03-08T14:55:10Z) - Automatic Detection Of Noise Events at Shooting Range Using Machine
Learning [0.0]
射撃範囲は、地方や国家当局の騒音規制の対象となっている。
騒音監視システムは、全体の音レベルを追跡するために用いられるが、活動を検出したり、イベント数を数えたりすることは滅多にない。
本研究では,ノイズイベントをカウントする自動検知システムの実現可能性と性能について検討する。
論文 参考訳(メタデータ) (2021-07-23T20:36:43Z) - Efficient Intent Detection with Dual Sentence Encoders [53.16532285820849]
本稿では,USE や ConveRT などの事前訓練された二重文エンコーダによるインテント検出手法を提案する。
提案するインテント検出器の有用性と適用性を示し,完全なBERT-Largeモデルに基づくインテント検出器よりも優れた性能を示す。
コードだけでなく、新しい挑戦的な単一ドメイン意図検出データセットもリリースしています。
論文 参考訳(メタデータ) (2020-03-10T15:33:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。