論文の概要: Microphone Array Based Surveillance Audio Classification
- arxiv url: http://arxiv.org/abs/2005.11348v1
- Date: Fri, 22 May 2020 18:35:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 08:48:25.821940
- Title: Microphone Array Based Surveillance Audio Classification
- Title(参考訳): マイクロホンアレーに基づく監視音声分類
- Authors: Dimitri Leandro de Oliveira Silva, Tito Spadini and Ricardo Suyama
- Abstract要約: この研究は7つの古典的分類器と2つのビームフォーミングアルゴリズムを、監視音の事象を検出するために評価した。
その結果, SVM と Delay-and-Sum (DaS) の組み合わせは, 最高精度 (最大86.0%) を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The work assessed seven classical classifiers and two beamforming algorithms
for detecting surveillance sound events. The tests included the use of AWGN
with -10 dB to 30 dB SNR. Data Augmentation was also employed to improve
algorithms' performance. The results showed that the combination of SVM and
Delay-and-Sum (DaS) scored the best accuracy (up to 86.0\%), but had high
computational cost ($\approx $ 402 ms), mainly due to DaS. The use of SGD also
seems to be a good alternative since it has achieved good accuracy either (up
to 85.3\%), but with quicker processing time ($\approx$ 165 ms).
- Abstract(参考訳): この研究は7つの古典的分類器と2つのビームフォーミングアルゴリズムで監視音を検知した。
試験にはAWGNを10dBから30dBのSNRで使用することが含まれていた。
データ拡張はアルゴリズムのパフォーマンス向上にも使用された。
その結果, SVM と Delay-and-Sum (DaS) の組み合わせは, 最高精度 (86.0\%) を示したが, 主に DaS による計算コストが高かった($ 402 ms)。
SGDの使用は、高い精度(最大85.3\%)を達成したが、より高速な処理時間($165 ms)で、良い代替手段であると思われる。
関連論文リスト
- Deep Active Speech Cancellation with Multi-Band Mamba Network [62.73250985838971]
アクティブ音声キャンセラ(ASC)のための新しい深層学習ネットワークを提案する。
提案したMulti-Band Mambaアーキテクチャは、入力音声を異なる周波数帯域にセグメントし、正確な反信号生成を可能にする。
実験の結果、ANCシナリオでは7.2dB、ASCでは6.2dBの改善が達成された。
論文 参考訳(メタデータ) (2025-02-03T09:22:26Z) - Intelligent Fault Diagnosis of Type and Severity in Low-Frequency, Low Bit-Depth Signals [0.6144680854063939]
この研究は、高パフォーマンスと低リソース消費のバランスをとることを目的として、不均衡なMaFaulDaデータセットの音声データを活用する。
精度は99.54%、F-Betaスコアは99.52%で、わずか6本の隆起木が8kHz、8ビット構成であった。
論文 参考訳(メタデータ) (2024-11-09T22:01:11Z) - Effects of Dataset Sampling Rate for Noise Cancellation through Deep Learning [1.024113475677323]
本研究では,従来のノイズキャンセリング手法の優れた代替手段として,ディープニューラルネットワーク(DNN)の利用について検討する。
ConvTasNETネットワークは、WHAM!、LibriMix、MS-2023 DNS Challengeなどのデータセットでトレーニングされた。
高サンプリングレート(48kHz)でトレーニングされたモデルは、トータル・ハーモニック・ディストーション(THD)と生成ニューラルコーデック(WARP-Q)の値に対するはるかに優れた評価指標を提供した。
論文 参考訳(メタデータ) (2024-05-30T16:20:44Z) - HAAQI-Net: A Non-intrusive Neural Music Audio Quality Assessment Model for Hearing Aids [30.305000305766193]
本稿では,難聴者を対象とした非侵襲的ディープラーニングに基づく音質評価モデルであるHAAQI-Netを紹介する。
HAAQIのスコアは、音楽のオーディオクリップや聴覚障害パターンから直接予測できる。
論文 参考訳(メタデータ) (2024-01-02T10:55:01Z) - ETAD: A Unified Framework for Efficient Temporal Action Detection [70.21104995731085]
時間的行動検出(TAD)のようなトリミングされていないビデオ理解は、しばしば計算資源に対する膨大な需要の苦痛に悩まされる。
我々は、効率的なエンド・ツー・エンドの時間的行動検出(ETAD)のための統合されたフレームワークを構築している。
ETADはTHUMOS-14とActivityNet-1.3の両方で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-05-14T21:16:21Z) - Automated Atrial Fibrillation Classification Based on Denoising Stacked
Autoencoder and Optimized Deep Network [1.7403133838762446]
心房細動(AFib)の発症率は世界中で増加傾向にある。
AFibのリスクを早期に検出するために,我々はディープニューラルネットワークに基づく自動検出システムを開発した。
Denoising Autoencoders (DAE) を用いて心電図信号を復調するエンド・ツー・エンドモデルを提案する。
論文 参考訳(メタデータ) (2022-01-26T21:45:48Z) - ECG-TCN: Wearable Cardiac Arrhythmia Detection with a Temporal
Convolutional Network [14.503893070243585]
シングルリード心電図信号は、心不整脈を検出、分類、予測する能力を提供する。
ウェアラブルプラットフォームでの利用が可能でありながら、高い精度を実現する新しい時間的畳み込みネットワーク(TCN)を提案します。
論文 参考訳(メタデータ) (2021-03-25T10:39:54Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z) - Detection of gravitational-wave signals from binary neutron star mergers
using machine learning [52.77024349608834]
本稿では,重力波検出器の時系列ひずみデータを用いたニューラルネットワークに基づく機械学習アルゴリズムを提案する。
信号対雑音比が25未満の信号に対する感度は6因子改善した。
保守的な推定は、我々のアルゴリズムが信号の到着からアラート発生までの平均10.2秒の遅延を発生させることを示している。
論文 参考訳(メタデータ) (2020-06-02T10:20:11Z) - ADAHESSIAN: An Adaptive Second Order Optimizer for Machine Learning [91.13797346047984]
本稿では,2次最適化アルゴリズムであるADAHESSIANを紹介する。
ADAHESSIANは、他の適応最適化手法と比較して、新しい最先端の成果を大きなマージンで達成することを示す。
論文 参考訳(メタデータ) (2020-06-01T05:00:51Z) - Improving Efficiency in Large-Scale Decentralized Distributed Training [58.80224380923698]
通信コストを最小化しつつ、スペクトルギャップを改善して(A)D-PSGDに基づくトレーニングを加速する手法を提案する。
提案手法の有効性を示すために,2000時間Switchboard音声認識タスクとImageNetコンピュータビジョンタスクの実験を行った。
論文 参考訳(メタデータ) (2020-02-04T04:29:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。