Fugu-MT 論文翻訳(概要): Microphone Array Based Surveillance Audio Classification

論文の概要: Microphone Array Based Surveillance Audio Classification

arxiv url: http://arxiv.org/abs/2005.11348v1
Date: Fri, 22 May 2020 18:35:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-30 08:48:25.821940
Title: Microphone Array Based Surveillance Audio Classification
Title（参考訳）: マイクロホンアレーに基づく監視音声分類
Authors: Dimitri Leandro de Oliveira Silva, Tito Spadini and Ricardo Suyama
Abstract要約: この研究は7つの古典的分類器と2つのビームフォーミングアルゴリズムを、監視音の事象を検出するために評価した。その結果, SVM と Delay-and-Sum (DaS) の組み合わせは, 最高精度 (最大86.0%) を示した。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The work assessed seven classical classifiers and two beamforming algorithms for detecting surveillance sound events. The tests included the use of AWGN with -10 dB to 30 dB SNR. Data Augmentation was also employed to improve algorithms' performance. The results showed that the combination of SVM and Delay-and-Sum (DaS) scored the best accuracy (up to 86.0\%), but had high computational cost ($\approx $ 402 ms), mainly due to DaS. The use of SGD also seems to be a good alternative since it has achieved good accuracy either (up to 85.3\%), but with quicker processing time ($\approx$ 165 ms).
Abstract（参考訳）: この研究は7つの古典的分類器と2つのビームフォーミングアルゴリズムで監視音を検知した。試験にはAWGNを10dBから30dBのSNRで使用することが含まれていた。データ拡張はアルゴリズムのパフォーマンス向上にも使用された。その結果, SVM と Delay-and-Sum (DaS) の組み合わせは, 最高精度 (86.0\%) を示したが, 主に DaS による計算コストが高かった($ 402 ms)。 SGDの使用は、高い精度(最大85.3\%)を達成したが、より高速な処理時間($165 ms)で、良い代替手段であると思われる。

関連論文リスト

$\ exttt{SPECS}$: Faster Test-Time Scaling through Speculative Drafts [55.231201692232894]
$textttSPECS$は、投機的デコードにインスパイアされた遅延対応のテスト時間スケーリングメソッドである。我々の結果は、$textttSPECS$matchはビームサーチの精度を上回り、最大$sim$19.1%のレイテンシを削減していることを示している。
論文参考訳（メタデータ） (2025-06-15T05:50:05Z)
Faster and Better LLMs via Latency-Aware Test-Time Scaling [52.10888685395448]
テスト時間スケーリング(TTS)は、推論時の言語モデル(LLM)の性能向上に有効であることが証明されている。既存の研究は、レイテンシに敏感な観点から、TSの効率性を見落としている。計算最適TSは、レイテンシが重要となるシナリオにおいて、必ずしも最低レイテンシをもたらすとは限らないことを実証する。
論文参考訳（メタデータ） (2025-05-26T07:51:30Z)
Deep Active Speech Cancellation with Multi-Band Mamba Network [62.73250985838971]
アクティブ音声キャンセラ(ASC)のための新しい深層学習ネットワークを提案する。提案したMulti-Band Mambaアーキテクチャは、入力音声を異なる周波数帯域にセグメントし、正確な反信号生成を可能にする。実験の結果、ANCシナリオでは7.2dB、ASCでは6.2dBの改善が達成された。
論文参考訳（メタデータ） (2025-02-03T09:22:26Z)
Intelligent Fault Diagnosis of Type and Severity in Low-Frequency, Low Bit-Depth Signals [0.6144680854063939]
この研究は、高パフォーマンスと低リソース消費のバランスをとることを目的として、不均衡なMaFaulDaデータセットの音声データを活用する。精度は99.54%、F-Betaスコアは99.52%で、わずか6本の隆起木が8kHz、8ビット構成であった。
論文参考訳（メタデータ） (2024-11-09T22:01:11Z)
Effects of Dataset Sampling Rate for Noise Cancellation through Deep Learning [1.024113475677323]
本研究では,従来のノイズキャンセリング手法の優れた代替手段として,ディープニューラルネットワーク(DNN)の利用について検討する。 ConvTasNETネットワークは、WHAM!、LibriMix、MS-2023 DNS Challengeなどのデータセットでトレーニングされた。高サンプリングレート(48kHz)でトレーニングされたモデルは、トータル・ハーモニック・ディストーション(THD)と生成ニューラルコーデック(WARP-Q)の値に対するはるかに優れた評価指標を提供した。
論文参考訳（メタデータ） (2024-05-30T16:20:44Z)
HAAQI-Net: A Non-intrusive Neural Music Audio Quality Assessment Model for Hearing Aids [30.305000305766193]
本稿では,難聴者を対象とした非侵襲的ディープラーニングに基づく音質評価モデルであるHAAQI-Netを紹介する。 HAAQIのスコアは、音楽のオーディオクリップや聴覚障害パターンから直接予測できる。
論文参考訳（メタデータ） (2024-01-02T10:55:01Z)
ETAD: A Unified Framework for Efficient Temporal Action Detection [70.21104995731085]
時間的行動検出(TAD)のようなトリミングされていないビデオ理解は、しばしば計算資源に対する膨大な需要の苦痛に悩まされる。我々は、効率的なエンド・ツー・エンドの時間的行動検出(ETAD)のための統合されたフレームワークを構築している。 ETADはTHUMOS-14とActivityNet-1.3の両方で最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (2022-05-14T21:16:21Z)
Automated Atrial Fibrillation Classification Based on Denoising Stacked Autoencoder and Optimized Deep Network [1.7403133838762446]
心房細動(AFib)の発症率は世界中で増加傾向にある。 AFibのリスクを早期に検出するために,我々はディープニューラルネットワークに基づく自動検出システムを開発した。 Denoising Autoencoders (DAE) を用いて心電図信号を復調するエンド・ツー・エンドモデルを提案する。
論文参考訳（メタデータ） (2022-01-26T21:45:48Z)
ECG-TCN: Wearable Cardiac Arrhythmia Detection with a Temporal Convolutional Network [14.503893070243585]
シングルリード心電図信号は、心不整脈を検出、分類、予測する能力を提供する。ウェアラブルプラットフォームでの利用が可能でありながら、高い精度を実現する新しい時間的畳み込みネットワーク(TCN)を提案します。
論文参考訳（メタデータ） (2021-03-25T10:39:54Z)
Bayesian Optimization with Machine Learning Algorithms Towards Anomaly Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。 ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文参考訳（メタデータ） (2020-08-05T19:29:35Z)
SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文参考訳（メタデータ） (2020-07-26T12:32:38Z)
Conditioned Time-Dilated Convolutions for Sound Event Detection [20.883760606514937]
本稿では,言語モデリングと同様に機能する時間分割畳み込みの条件付けのための新しいアルゴリズムを提案する。我々は、無料で利用可能なTUT-SED Syntheticデータセットを使用し、フレームあたりの平均$textF_1$スコアとフレームあたりの平均エラー率を用いて、メソッドの性能を評価する。
論文参考訳（メタデータ） (2020-07-10T06:05:23Z)
Detection of gravitational-wave signals from binary neutron star mergers using machine learning [52.77024349608834]
本稿では,重力波検出器の時系列ひずみデータを用いたニューラルネットワークに基づく機械学習アルゴリズムを提案する。信号対雑音比が25未満の信号に対する感度は6因子改善した。保守的な推定は、我々のアルゴリズムが信号の到着からアラート発生までの平均10.2秒の遅延を発生させることを示している。
論文参考訳（メタデータ） (2020-06-02T10:20:11Z)
ADAHESSIAN: An Adaptive Second Order Optimizer for Machine Learning [91.13797346047984]
本稿では,2次最適化アルゴリズムであるADAHESSIANを紹介する。 ADAHESSIANは、他の適応最適化手法と比較して、新しい最先端の成果を大きなマージンで達成することを示す。
論文参考訳（メタデータ） (2020-06-01T05:00:51Z)
Improving Efficiency in Large-Scale Decentralized Distributed Training [58.80224380923698]
通信コストを最小化しつつ、スペクトルギャップを改善して(A)D-PSGDに基づくトレーニングを加速する手法を提案する。提案手法の有効性を示すために,2000時間Switchboard音声認識タスクとImageNetコンピュータビジョンタスクの実験を行った。
論文参考訳（メタデータ） (2020-02-04T04:29:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。