論文の概要: SHAMaNS: Sound Localization with Hybrid Alpha-Stable Spatial Measure and Neural Steerer
- arxiv url: http://arxiv.org/abs/2506.18954v1
- Date: Mon, 23 Jun 2025 13:11:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.312927
- Title: SHAMaNS: Sound Localization with Hybrid Alpha-Stable Spatial Measure and Neural Steerer
- Title(参考訳): SHAMaNS:ハイブリッドアルファ安定空間測定とニューラルステアによる音像定位
- Authors: Diego Di Carlo, Mathieu Fontaine, Aditya Arie Nugraha, Yoshiaki Bando, Kazuyoshi Yoshii,
- Abstract要約: 本稿では、観測信号に対する$alpha$-stableモデルと、ステアリングベクトルをモデル化するためのニューラルネットワークに基づくアプローチを組み合わせた、音源定位(SSL)手法について述べる。
具体的には、ニューラルネットワーク(Neural Steerer)と呼ばれる物理インフォームドニューラルネットワークを用いて、測定されたステアリングベクトル(SV)を固定されたマイクロフォンアレイ上に補間する。
提案手法は,複数音源の場合の最先端手法より優れる。
- 参考スコア(独自算出の注目度): 15.912593536596267
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes a sound source localization (SSL) technique that combines an $\alpha$-stable model for the observed signal with a neural network-based approach for modeling steering vectors. Specifically, a physics-informed neural network, referred to as Neural Steerer, is used to interpolate measured steering vectors (SVs) on a fixed microphone array. This allows for a more robust estimation of the so-called $\alpha$-stable spatial measure, which represents the most plausible direction of arrival (DOA) of a target signal. As an $\alpha$-stable model for the non-Gaussian case ($\alpha$ $\in$ (0, 2)) theoretically defines a unique spatial measure, we choose to leverage it to account for residual reconstruction error of the Neural Steerer in the downstream tasks. The objective scores indicate that our proposed technique outperforms state-of-the-art methods in the case of multiple sound sources.
- Abstract(参考訳): 本稿では、観測信号に対する$\alpha$-stableモデルと、ステアリングベクトルをモデル化するためのニューラルネットワークに基づくアプローチを組み合わせた、音源定位(SSL)手法について述べる。
具体的には、ニューラルネットワーク(Neural Steerer)と呼ばれる物理インフォームドニューラルネットワークを用いて、測定されたステアリングベクトル(SV)を固定されたマイクロフォンアレイ上に補間する。
これにより、ターゲット信号の最も確実な到着方向(DOA)を表すいわゆる$\alpha$-stable空間測度をより堅牢に推定することができる。
非ガウス的ケースに対する$\alpha$-stableモデル($\alpha$$\in$ (0, 2))は、理論的に一意な空間測度を定義するため、下流タスクにおけるニューラルステアラーの残留再構成誤差を考慮に入れた。
これらの結果から,提案手法は複数音源の場合の最先端手法よりも優れていたことが示唆された。
関連論文リスト
- Observation Noise and Initialization in Wide Neural Networks [9.163214210191814]
任意の事前平均関数を可能にするテキストシフトネットワークを導入する。
我々の理論的な洞察は、観測ノイズとネットワークアーキテクチャの異なる値に関する実験によって実証的に検証されている。
論文 参考訳(メタデータ) (2025-02-03T17:39:45Z) - Noise in the reverse process improves the approximation capabilities of
diffusion models [27.65800389807353]
生成モデリングにおける最先端技術であるスコアベース生成モデリング(SGM)では、リバースプロセスは決定論的手法よりも優れた性能を発揮することが知られている。
本稿では,ニューラル常微分方程式 (ODE) とニューラルディメンション方程式 (SDE) を逆過程として比較し,この現象の核となる。
我々は、Fokker-Planck方程式の軌跡を近似するニューラルSDEの能力を解析し、ニューラルティの利点を明らかにする。
論文 参考訳(メタデータ) (2023-12-13T02:39:10Z) - Capturing dynamical correlations using implicit neural representations [85.66456606776552]
実験データから未知のパラメータを復元するために、モデルハミルトンのシミュレーションデータを模倣するために訓練されたニューラルネットワークと自動微分を組み合わせた人工知能フレームワークを開発する。
そこで本研究では, 実時間から多次元散乱データに適用可能な微分可能なモデルを1回だけ構築し, 訓練する能力について述べる。
論文 参考訳(メタデータ) (2023-04-08T07:55:36Z) - On the Identifiability and Estimation of Causal Location-Scale Noise
Models [122.65417012597754]
位置スケール・異方性雑音モデル(LSNM)のクラスについて検討する。
症例によっては, 因果方向が同定可能であることが示唆された。
我々は,LSNMの2つの推定器を提案し,その1つは(非線形)特徴写像に基づく推定器と,1つはニューラルネットワークに基づく推定器を提案する。
論文 参考訳(メタデータ) (2022-10-13T17:18:59Z) - Inverting brain grey matter models with likelihood-free inference: a
tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。
我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。
次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文 参考訳(メタデータ) (2021-11-15T09:08:27Z) - Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。
我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。
私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文 参考訳(メタデータ) (2020-11-17T12:52:18Z) - The Generalized Lasso with Nonlinear Observations and Generative Priors [63.541900026673055]
我々は、幅広い測定モデルで満たされるガウス下測度を仮定する。
この結果から, 局所埋込特性を仮定して, 均一回復保証まで拡張できることが示唆された。
論文 参考訳(メタデータ) (2020-06-22T16:43:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。