論文の概要: Direction of Arrival Estimation of Sound Sources Using Icosahedral CNNs
- arxiv url: http://arxiv.org/abs/2203.16940v1
- Date: Thu, 31 Mar 2022 10:52:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-01 16:51:58.831384
- Title: Direction of Arrival Estimation of Sound Sources Using Icosahedral CNNs
- Title(参考訳): Icosahedral CNNを用いた音源位置推定の方向性
- Authors: David Diaz-Guerra, Antonio Miguel, Jose R. Beltran
- Abstract要約: Icosahedral Convolutional Neural Network (CNN) に基づく音源の指向性(DOA)推定の新しいモデルを提案する。
このイコサヘドラルCNNは、球状回転の連続空間のよい近似を示すイコサヘドロンの60回転対称性に同値である。
問題の等式に適合するモデルを使用することで、計算コストの低減とロバスト性の向上により、他の最先端モデルよりも優れることを示す。
- 参考スコア(独自算出の注目度): 10.089520556398574
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a new model for Direction of Arrival (DOA)
estimation of sound sources based on an Icosahedral Convolutional Neural
Network (CNN) applied over SRP-PHAT power maps computed from the signals
received by a microphone array. This icosahedral CNN is equivariant to the 60
rotational symmetries of the icosahedron, which represent a good approximation
of the continuous space of spherical rotations, and can be implemented using
standard 2D convolutional layers, having a lower computational cost than most
of the spherical CNNs. In addition, instead of using fully connected layers
after the icosahedral convolutions, we propose a new soft-argmax function that
can be seen as a differentiable version of the argmax function and allows us to
solve the DOA estimation as a regression problem interpreting the output of the
convolutional layers as a probability distribution. We prove that using models
that fit the equivariances of the problem allows us to outperform other
state-of-the-art models with a lower computational cost and more robustness,
obtaining root mean square localization errors lower than 10{\deg} even in
scenarios with a reverberation time $T_{60}$ of 1.5 s.
- Abstract(参考訳): 本稿では,マイクロホンアレイが受信した信号から計算したSRP-PHATパワーマップ上に印加されたIcosahedral Convolutional Neural Network (CNN)に基づく音源の指向性(DOA)推定モデルを提案する。
このイコサヘドラルcnnは、球面回転の連続空間のよい近似を表すイコサヘドロンの60回転対称性と等価であり、標準的な2次元畳み込み層を用いて実装することができ、球面cnnの多くよりも計算コストが低い。
また,コサヘドラル畳み込み後に完全連結層を用いる代わりに,argmax関数の微分可能なバージョンとして見ることができ,畳み込み層の出力を確率分布として解釈する回帰問題としてDOA推定を解くことができる新しいソフトアルグマックス関数を提案する。
問題の等式に適合するモデルを用いることで、残響時間$T_{60}$1.5 sのシナリオであっても、根平均2乗の局所化誤差を10{\degより低くし、計算コストとロバスト性で他の最先端モデルよりも優れることを示す。
関連論文リスト
- A Mean-Field Analysis of Neural Stochastic Gradient Descent-Ascent for Functional Minimax Optimization [90.87444114491116]
本稿では,超パラメトリック化された2層ニューラルネットワークの無限次元関数クラス上で定義される最小最適化問題について検討する。
i) 勾配降下指数アルゴリズムの収束と, (ii) ニューラルネットワークの表現学習に対処する。
その結果、ニューラルネットワークによって誘導される特徴表現は、ワッサーシュタイン距離で測定された$O(alpha-1)$で初期表現から逸脱することが許された。
論文 参考訳(メタデータ) (2024-04-18T16:46:08Z) - A predictive physics-aware hybrid reduced order model for reacting flows [65.73506571113623]
反応流問題の解法として,新しいハイブリッド型予測次数モデル (ROM) を提案する。
自由度は、数千の時間的点から、対応する時間的係数を持ついくつかのPODモードへと減少する。
時間係数を予測するために、2つの異なるディープラーニングアーキテクチャがテストされている。
論文 参考訳(メタデータ) (2023-01-24T08:39:20Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - Inverting brain grey matter models with likelihood-free inference: a
tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。
我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。
次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文 参考訳(メタデータ) (2021-11-15T09:08:27Z) - Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。
我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。
私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文 参考訳(メタデータ) (2020-11-17T12:52:18Z) - Lightning-Fast Gravitational Wave Parameter Inference through Neural
Amortization [6.810835072367285]
ニューラルシミュレーションに基づく推論の最近の進歩は、推論時間を最大3桁スピードアップすることができる。
シミュレーションされた重力波のパラメータの信頼区間を精度良く推定する。
論文 参考訳(メタデータ) (2020-10-24T16:48:24Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Baryon acoustic oscillations reconstruction using convolutional neural
networks [1.9262162668141078]
深部畳み込みニューラルネットワーク(CNN)に基づく重要な宇宙情報を含むバリオン音響発振(BAO)信号の再構成手法を提案する。
一方の宇宙論で訓練されたネットワークは、他の宇宙論とは無関係に非線型性に失われる情報を復元し、BAOピークを再構築することができる。
論文 参考訳(メタデータ) (2020-02-24T13:18:31Z) - Gravitational-wave parameter estimation with autoregressive neural
network flows [0.0]
深部ニューラルネットワークを用いた重力波データから二元ブラックホール系のパラメータを高速に推定するための自己回帰正規化フローを導入する。
正規化フロー(英: normalizing flow)は、単純な確率分布からより複雑なものへの変換を誘導するために用いられるサンプル空間上の可逆写像である。
可変オートエンコーダフレームワークに自己回帰フローを組み込むことにより,より強力な潜在変数モデルを構築する。
論文 参考訳(メタデータ) (2020-02-18T15:44:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。