論文の概要: Acoustic-Net: A Novel Neural Network for Sound Localization and
Quantification
- arxiv url: http://arxiv.org/abs/2203.16988v1
- Date: Thu, 31 Mar 2022 12:20:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-01 16:51:34.685158
- Title: Acoustic-Net: A Novel Neural Network for Sound Localization and
Quantification
- Title(参考訳): 音響ネットワーク:音像定位と量子化のための新しいニューラルネットワーク
- Authors: Guanxing Zhou, Hao Liang, Xinghao Ding, Yue Huang, Xiaotong Tu, and
Saqlain Abbas
- Abstract要約: アコースティックネットと呼ばれる新しいニューラルネットワークが提案され、音源の特定と定量化が可能である。
実験により,提案手法は音源予測の精度と計算速度を大幅に向上させることを示した。
- 参考スコア(独自算出の注目度): 28.670240455952317
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Acoustic source localization has been applied in different fields, such as
aeronautics and ocean science, generally using multiple microphones array data
to reconstruct the source location. However, the model-based beamforming
methods fail to achieve the high-resolution of conventional beamforming maps.
Deep neural networks are also appropriate to locate the sound source, but in
general, these methods with complex network structures are hard to be
recognized by hardware. In this paper, a novel neural network, termed the
Acoustic-Net, is proposed to locate and quantify the sound source simply using
the original signals. The experiments demonstrate that the proposed method
significantly improves the accuracy of sound source prediction and the
computing speed, which may generalize well to real data. The code and trained
models are available at https://github.com/JoaquinChou/Acoustic-Net.
- Abstract(参考訳): 音響ソースのローカライゼーションは、航空学や海洋科学など、さまざまな分野に適用され、一般に複数のマイクロフォンアレイデータを使用してソース位置を再構築している。
しかし、モデルに基づくビームフォーミング法は従来のビームフォーミングマップの高解像度化には失敗した。
ディープニューラルネットワークは音源の特定にも適しているが、一般に複雑なネットワーク構造を持つこれらの手法はハードウェアで認識することが難しい。
本稿では,アコースティックネットと呼ばれる新しいニューラルネットワークを提案し,音源の同定と定量化を行う。
実験により,提案手法は音源予測の精度と計算速度を大幅に向上し,実データへの一般化が期待できることを示した。
コードとトレーニングされたモデルはhttps://github.com/joaquinchou/acoustic-netで入手できる。
関連論文リスト
- Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - Dual input neural networks for positional sound source localization [19.07039703121673]
本稿では、これらの2つのデータ型をニューラルネットワークでモデル化するための、単純かつ効果的な方法として、Dual Input Neural Networks(DI-NN)を紹介する。
難易度と現実性の異なるシナリオに基づいて提案したDI-NNをトレーニングし、評価し、代替アーキテクチャと比較する。
以上の結果から,DI-NNはLS法よりも5倍,CRNNより2倍低い位置推定誤差を達成できることがわかった。
論文 参考訳(メタデータ) (2023-08-08T09:59:56Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - Millimeter Wave Localization with Imperfect Training Data using Shallow
Neural Networks [13.454939391912095]
我々は,mWaveデバイスを屋内でローカライズするための浅層ニューラルネットワークモデルを提案する。
このモデルは、文献で提案されているものよりもはるかに少ない重量を必要とする。
また,位置推定を幾何学ベースのmWaveローカライゼーションアルゴリズムから検索することで,トレーニングデータ収集の取り組みを緩和することを提案する。
論文 参考訳(メタデータ) (2021-12-09T16:03:30Z) - Three-Way Deep Neural Network for Radio Frequency Map Generation and
Source Localization [67.93423427193055]
空間、時間、周波数領域にわたる無線スペクトルのモニタリングは、5Gと6G以上の通信技術において重要な特徴となる。
本稿では,空間領域全体にわたる不規則分散計測を補間するGAN(Generative Adversarial Network)機械学習モデルを提案する。
論文 参考訳(メタデータ) (2021-11-23T22:25:10Z) - A Review of Sound Source Localization with Deep Learning Methods [71.18444724397486]
本稿では,単音源および複数音源の音源定位のための深層学習手法について概説する。
この文脈におけるニューラルネットワークを用いた局所化文献の網羅的なトポグラフィーを提供する。
文献レビューを要約したテーブルをレビューの最後に提供し、所定の対象特性のセットでメソッドを素早く検索する。
論文 参考訳(メタデータ) (2021-09-08T07:25:39Z) - Voice Activity Detection for Transient Noisy Environment Based on
Diffusion Nets [13.558688470594674]
過渡音と定常音の音響環境における音声活動検出について検討する。
音声フレームと非音声音声フレームの空間パターンを独立に学習し,その基礎となる幾何学的構造を学習する。
ディープニューラルネットワークは、音声フレームと非音声フレームを分離するように訓練される。
論文 参考訳(メタデータ) (2021-06-25T17:05:26Z) - PILOT: Introducing Transformers for Probabilistic Sound Event
Localization [107.78964411642401]
本稿では,受信したマルチチャンネル音声信号の時間的依存性を自己アテンション機構によってキャプチャする,トランスフォーマーに基づく新しい音声イベント定位フレームワークを提案する。
このフレームワークは, 公開されている3つの音声イベントローカライズデータセットを用いて評価し, 局所化誤差と事象検出精度の点で最先端の手法と比較した。
論文 参考訳(メタデータ) (2021-06-07T18:29:19Z) - AutoSpeech: Neural Architecture Search for Speaker Recognition [108.69505815793028]
本稿では,AutoSpeech という名称の話者認識タスクに対して,最初のニューラルアーキテクチャ探索アプローチを提案する。
提案アルゴリズムはまず,ニューラルネットワークの最適操作の組み合わせを特定し,その後,複数回重ねてCNNモデルを導出する。
得られたCNNアーキテクチャは,モデル複雑性を低減しつつ,VGG-M,ResNet-18,ResNet-34のバックボーンに基づく現在の話者認識システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-05-07T02:53:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。