論文の概要: Room transfer function reconstruction using complex-valued neural
networks and irregularly distributed microphones
- arxiv url: http://arxiv.org/abs/2402.04866v1
- Date: Thu, 1 Feb 2024 21:16:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-11 15:11:59.213930
- Title: Room transfer function reconstruction using complex-valued neural
networks and irregularly distributed microphones
- Title(参考訳): 複素数値ニューラルネットワークと不規則分散マイクロホンを用いた室内伝達関数再構成
- Authors: Francesca Ronchini, Luca Comanducci, Mirco Pezzoli, Fabio Antonacci,
Augusto Sarti
- Abstract要約: 第1室共鳴の周波数範囲における室内伝達関数を推定するために,複素数値ニューラルネットワークを用いる。
私たちの知る限りでは、複雑な評価されたニューラルネットワークが部屋の移動関数を推定するのに使用されるのは、これが初めてです。
- 参考スコア(独自算出の注目度): 16.314590402878
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reconstructing the room transfer functions needed to calculate the complex
sound field in a room has several important real-world applications. However,
an unpractical number of microphones is often required. Recently, in addition
to classical signal processing methods, deep learning techniques have been
applied to reconstruct the room transfer function starting from a very limited
set of room transfer functions measured at scattered points in the room. In
this study, we employ complex-valued neural networks to estimate room transfer
functions in the frequency range of the first room resonances, using a few
irregularly distributed microphones. To the best of our knowledge, this is the
first time complex-valued neural networks are used to estimate room transfer
functions. To analyze the benefits of applying complex-valued optimization to
the considered task, we compare the proposed technique with a state-of-the-art
real-valued neural network method and a state-of-the-art kernel-based signal
processing approach for sound field reconstruction, showing that the proposed
technique exhibits relevant advantages in terms of phase accuracy and overall
quality of the reconstructed sound field.
- Abstract(参考訳): 室内の複雑な音場を計算するのに必要な室内伝達関数の再構築には、いくつかの重要な実世界応用がある。
しかし、実用的でないマイクの数がしばしば必要となる。
近年,従来の信号処理手法に加えて,室内の散乱点で測定した室内伝達関数のごく限られた集合から部屋伝達関数を再構築する深層学習手法が適用されている。
本研究では,数個の不規則分散マイクロホンを用いて,第1室共鳴周波数域における室内伝達関数を推定するために,複雑な評価ニューラルネットワークを用いる。
私たちの知る限りでは、複雑な値を持つニューラルネットワークがルーム転送関数の推定に使用されるのはこれが初めてです。
提案手法は,提案手法と最先端の実数値ニューラルネットワーク法と,音場再構成のための最先端のカーネルベース信号処理手法とを比較し,音場の位相精度と音場全体の品質の面で適切な利点を示すことを示す。
関連論文リスト
- Digital noise spectroscopy with a quantum sensor [57.53000001488777]
本稿では,ノイズプロセスの自己相関をサンプリングし,再構成するための量子センシングプロトコルを実験的に導入し,実証する。
ウォルシュノイズ分光法はスピンフリップパルスの単純な配列を利用してディジタルフィルタの完全基底を生成する。
ダイヤモンド中の単一窒素空孔中心の電子スピン上での核スピン浴により生じる有効磁場の自己相関関数を実験的に再構成した。
論文 参考訳(メタデータ) (2022-12-19T02:19:35Z) - Transformer Meets Boundary Value Inverse Problems [4.165221477234755]
変圧器を用いた深部直接サンプリング法は境界値逆問題のクラスを解くために提案される。
慎重に設計されたデータと再構成された画像の間に学習した逆演算子を評価することにより、リアルタイムな再構成を実現する。
論文 参考訳(メタデータ) (2022-09-29T17:45:25Z) - PREF: Phasorial Embedding Fields for Compact Neural Representations [54.44527545923917]
本稿では,脳神経信号モデリングと再構成作業を容易にするためのコンパクトな表現として,ファサール埋め込みフィールドemphPREFを提案する。
実験の結果,PreFをベースとしたニューラル信号処理技術は,2次元画像補完,3次元SDF表面回帰,5次元放射野再構成と同等であることがわかった。
論文 参考訳(メタデータ) (2022-05-26T17:43:03Z) - Parallel frequency function-deep neural network for efficient complex
broadband signal approximation [1.536989504296526]
ニューラルネットワークは本質的に、特徴フィッティングのためのネットワーク重みを調整することで、高次元の複雑なマッピングモデルである。
ネットワークトレーニングにおけるスペクトルバイアスは、ブロードバンド信号に高周波成分を適合させるには耐え難い訓練エポックをもたらす。
並列周波数関数ディープニューラルネットワーク(PFF-DNN)を提案する。
論文 参考訳(メタデータ) (2021-06-19T01:39:13Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - PILOT: Introducing Transformers for Probabilistic Sound Event
Localization [107.78964411642401]
本稿では,受信したマルチチャンネル音声信号の時間的依存性を自己アテンション機構によってキャプチャする,トランスフォーマーに基づく新しい音声イベント定位フレームワークを提案する。
このフレームワークは, 公開されている3つの音声イベントローカライズデータセットを用いて評価し, 局所化誤差と事象検出精度の点で最先端の手法と比較した。
論文 参考訳(メタデータ) (2021-06-07T18:29:19Z) - Learning Frequency Domain Approximation for Binary Neural Networks [68.79904499480025]
フーリエ周波数領域における符号関数の勾配を正弦関数の組み合わせを用いて推定し,BNNの訓練を行う。
いくつかのベンチマークデータセットとニューラルネットワークの実験により、この手法で学習したバイナリネットワークが最先端の精度を達成することが示されている。
論文 参考訳(メタデータ) (2021-03-01T08:25:26Z) - Estimation of the Mean Function of Functional Data via Deep Neural
Networks [6.230751621285321]
関数データに対して非パラメトリック回帰を行うディープニューラルネットワーク手法を提案する。
本手法は,アルツハイマー病患者における陽電子放出トモグラフィ画像の解析に用いる。
論文 参考訳(メタデータ) (2020-12-08T17:18:16Z) - DeepPhaseCut: Deep Relaxation in Phase for Unsupervised Fourier Phase
Retrieval [31.380061715549584]
本稿では、フーリエ位相探索のための新しい、教師なしフィードフォワードニューラルネットワークを提案する。
ニューラルネットワークを正規化用語や、教師付きトレーニングのためのエンドツーエンドのブラックボックスモデルとして使用している既存のディープラーニングアプローチとは異なり、我々のアルゴリズムは、教師なし学習フレームワークにおけるPhaseCutアルゴリズムのフィードフォワードニューラルネットワーク実装である。
我々のネットワークは2つの生成器で構成されている: 1つは位相損失を用いた位相推定用で、もう1つは画像再構成用で、これらは全て一致したデータを持たないCycleGANフレームワークを用いて同時に訓練されている。
論文 参考訳(メタデータ) (2020-11-20T16:10:08Z) - Implicit recurrent networks: A novel approach to stationary input
processing with recurrent neural networks in deep learning [0.0]
本研究では,ニューラルネットの新たな実装を深層学習に導入し,検証する。
繰り返しネットワークの暗黙的な実装にバックプロパゲーションアルゴリズムを実装するアルゴリズムを提案する。
シングルレイヤの暗黙的リカレントネットワークはXOR問題を解くことができ、一方、単調に活性化関数が増加するフィードフォワードネットワークは、このタスクで失敗する。
論文 参考訳(メタデータ) (2020-10-20T18:55:32Z) - Multi-Tones' Phase Coding (MTPC) of Interaural Time Difference by
Spiking Neural Network [68.43026108936029]
雑音の多い実環境下での正確な音像定位のための純粋スパイクニューラルネットワーク(SNN)に基づく計算モデルを提案する。
このアルゴリズムを,マイクロホンアレイを用いたリアルタイムロボットシステムに実装する。
実験の結果, 平均誤差方位は13度であり, 音源定位に対する他の生物学的に妥当なニューロモルフィックアプローチの精度を上回っていることがわかった。
論文 参考訳(メタデータ) (2020-07-07T08:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。