Fugu-MT 論文翻訳(概要): Deep Impulse Responses: Estimating and Parameterizing Filters with Deep Networks

論文の概要: Deep Impulse Responses: Estimating and Parameterizing Filters with Deep Networks

arxiv url: http://arxiv.org/abs/2202.03416v1
Date: Mon, 7 Feb 2022 18:57:23 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-08 18:42:24.452103
Title: Deep Impulse Responses: Estimating and Parameterizing Filters with Deep Networks
Title（参考訳）: ディープインパルス応答:ディープネットワークを用いたフィルタの推定とパラメータ化
Authors: Alexander Richard, Peter Dodds, Vamsi Krishna Ithapu
Abstract要約: 高雑音および地中設定におけるインパルス応答推定は難しい問題である。本稿では,ニューラル表現学習の最近の進歩に基づいて,インパルス応答のパラメータ化と推定を行う新しいフレームワークを提案する。
参考スコア（独自算出の注目度）: 76.830358429947
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Impulse response estimation in high noise and in-the-wild settings, with minimal control of the underlying data distributions, is a challenging problem. We propose a novel framework for parameterizing and estimating impulse responses based on recent advances in neural representation learning. Our framework is driven by a carefully designed neural network that jointly estimates the impulse response and the (apriori unknown) spectral noise characteristics of an observed signal given the source signal. We demonstrate robustness in estimation, even under low signal-to-noise ratios, and show strong results when learning from spatio-temporal real-world speech data. Our framework provides a natural way to interpolate impulse responses on a spatial grid, while also allowing for efficiently compressing and storing them for real-time rendering applications in augmented and virtual reality.
Abstract（参考訳）: 基礎となるデータ分布を最小限に抑えた高雑音および電界環境におけるインパルス応答推定は難しい問題である。ニューラル表現学習の最近の進歩に基づくインパルス応答のパラメータ化と推定のための新しいフレームワークを提案する。我々のフレームワークは、インパルス応答と観測信号のスペクトルノイズ特性を併用して推定する、慎重に設計されたニューラルネットワークによって駆動される。信号対雑音比が低い場合でも,推定のロバスト性を示し,時空間実世界音声データから学習した場合の強い結果を示す。我々のフレームワークは、空間グリッド上でインパルス応答を補間する自然な方法を提供すると同時に、拡張現実およびバーチャルリアリティーにおけるリアルタイムレンダリングアプリケーションのためにそれらを効率的に圧縮し、保存することを可能にする。

関連論文リスト

Explicit Context-Driven Neural Acoustic Modeling for High-Fidelity RIR Generation [17.013738637228553]
所与の場所で粗い部屋メッシュを問合せし,局所文脈の明示的な表現として距離分布を抽出するメッシュ注入型ニューラルネットワーク(MiNAF)を提案する。我々のアプローチは、明示的な局所幾何学的特徴を取り入れることで、より正確なRIR予測を生成する上で、ニューラルネットワークをより導出できることを実証している。
論文参考訳（メタデータ） (2025-09-18T17:57:07Z)
Neural Velocity for hyperparameter tuning [14.916521676239894]
NeVeは、学習率を調整し、停止基準を定義する、ダイナミックなトレーニングアプローチである。神経速度は各ニューロンの伝達関数の変化率を測定する。
論文参考訳（メタデータ） (2025-07-07T09:32:25Z)
Neuromorphic Wireless Split Computing with Resonate-and-Fire Neurons [69.73249913506042]
本稿では、共振器(RF)ニューロンを用いて時間領域信号を直接処理する無線スプリットコンピューティングアーキテクチャについて検討する。可変周波数で共鳴することにより、RFニューロンは低スパイク活性を維持しながら時間局在スペクトル特徴を抽出する。実験の結果,提案したRF-SNNアーキテクチャは従来のLIF-SNNやANNと同等の精度を達成できることがわかった。
論文参考訳（メタデータ） (2025-06-24T21:14:59Z)
Synergistic Integration of Coordinate Network and Tensorial Feature for Improving Neural Radiance Fields from Sparse Inputs [26.901819636977912]
本稿では,低周波信号に対する強いバイアスで知られる座標ネットワークと多面表現を統合する手法を提案する。提案手法は,スパース入力を持つ静的および動的NeRFのベースラインモデルよりも優れていることを示す。
論文参考訳（メタデータ） (2024-05-13T15:42:46Z)
Neural Acoustic Context Field: Rendering Realistic Room Impulse Response With Neural Fields [61.07542274267568]
このレターでは、音声シーンをパラメータ化するためのNACFと呼ばれる新しいニューラルネットワークコンテキストフィールドアプローチを提案する。 RIRのユニークな性質により、時間相関モジュールとマルチスケールエネルギー崩壊基準を設計する。実験の結果,NACFは既存のフィールドベース手法よりも顕著なマージンで優れていた。
論文参考訳（メタデータ） (2023-09-27T19:50:50Z)
Bayesian inference and neural estimation of acoustic wave propagation [10.980762871305279]
本稿では,物理と機械学習を組み合わせて音響信号を解析する新しい枠組みを提案する。この課題のために, スペクトル音響特性を推定するベイズ推定法, 前方および後方の物理的損失をニューラルネットワークに装備するニューラルネットワーク物理モデル, ベンチマークとして機能する非線形最小二乗法, の3つの手法が開発された。このフレームワークの単純さと効率性は、シミュレーションデータ上で実証的に検証されている。
論文参考訳（メタデータ） (2023-05-28T15:14:46Z)
Synthetic Wave-Geometric Impulse Responses for Improved Speech Dereverberation [69.1351513309953]
室内インパルス応答 (RIR) の低周波成分を正確にシミュレートすることが, 良好な脱ヴァーベレーションを実現する上で重要であることを示す。本研究では, ハイブリッド合成RIRで訓練された音声残響モデルが, 従来の幾何線トレーシング法により学習されたRIRで訓練されたモデルよりも優れていたことを示す。
論文参考訳（メタデータ） (2022-12-10T20:15:23Z)
Towards Improved Room Impulse Response Estimation for Speech Recognition [53.04440557465013]
遠距離場自動音声認識(ASR)におけるブラインドルームインパルス応答(RIR)推定システムを提案する。まず、改良されたRIR推定と改善されたASR性能の関連性について、ニューラルネットワークを用いたRIR推定器の評価を行った。次に、残響音声からRIR特徴を符号化し、符号化された特徴からRIRを構成するGANベースのアーキテクチャを提案する。
論文参考訳（メタデータ） (2022-11-08T00:40:27Z)
Likelihood-Free Parameter Estimation with Neural Bayes Estimators [0.0]
ニューラルネットワークは、データをパラメータポイント推定にマッピングするニューラルネットワークである。我々は,この比較的新しい推論ツールに対する統計学者の意識を高め,ユーザフレンドリーなオープンソースソフトウェアを提供することで,その採用を促進することを目的としている。
論文参考訳（メタデータ） (2022-08-27T06:58:16Z)
Robust Learning of Recurrent Neural Networks in Presence of Exogenous Noise [22.690064709532873]
入力雑音を受けるRNNモデルに対するトラクタブルロバストネス解析を提案する。線形化手法を用いてロバストネス測度を効率的に推定することができる。提案手法はリカレントニューラルネットワークのロバスト性を大幅に改善する。
論文参考訳（メタデータ） (2021-05-03T16:45:05Z)
Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文参考訳（メタデータ） (2020-11-17T12:52:18Z)
Inferring, Predicting, and Denoising Causal Wave Dynamics [3.9407250051441403]
DISTANA(Distributed Artificial Neural Network Architecture)は、グラフ畳み込みニューラルネットワークである。 DISTANAは、再帰パターンが観測されるので、データストリームを飾るのに非常に適していることを示す。安定かつ正確なクローズドループ予測を数百の時間ステップで生成する。
論文参考訳（メタデータ） (2020-09-19T08:33:53Z)
Temporal-Spatial Neural Filter: Direction Informed End-to-End Multi-channel Target Speech Separation [66.46123655365113]
ターゲット音声分離とは、混合信号からターゲット話者の音声を抽出することを指す。主な課題は、複雑な音響環境とリアルタイム処理の要件である。複数話者混合から対象音声波形を直接推定する時間空間ニューラルフィルタを提案する。
論文参考訳（メタデータ） (2020-01-02T11:12:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。