論文の概要: Integrating Statistical Uncertainty into Neural Network-Based Speech
Enhancement
- arxiv url: http://arxiv.org/abs/2203.02288v1
- Date: Fri, 4 Mar 2022 12:55:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-07 16:20:06.730623
- Title: Integrating Statistical Uncertainty into Neural Network-Based Speech
Enhancement
- Title(参考訳): ニューラルネットワークに基づく音声強調への統計的不確かさの統合
- Authors: Huajian Fang, Tal Peer, Stefan Wermter, Timo Gerkmann
- Abstract要約: ニューラルネットワークに基づく音声強調における不確実性モデリングの利点について検討する。
点推定の代わりに分布を推定することにより、各推定に関連付けられた不確実性をモデル化することができる。
- 参考スコア(独自算出の注目度): 27.868722093985006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech enhancement in the time-frequency domain is often performed by
estimating a multiplicative mask to extract clean speech. However, most neural
network-based methods perform point estimation, i.e., their output consists of
a single mask. In this paper, we study the benefits of modeling uncertainty in
neural network-based speech enhancement. For this, our neural network is
trained to map a noisy spectrogram to the Wiener filter and its associated
variance, which quantifies uncertainty, based on the maximum a posteriori (MAP)
inference of spectral coefficients. By estimating the distribution instead of
the point estimate, one can model the uncertainty associated with each
estimate. We further propose to use the estimated Wiener filter and its
uncertainty to build an approximate MAP (A-MAP) estimator of spectral
magnitudes, which in turn is combined with the MAP inference of spectral
coefficients to form a hybrid loss function to jointly reinforce the
estimation. Experimental results on different datasets show that the proposed
method can not only capture the uncertainty associated with the estimated
filters, but also yield a higher enhancement performance over comparable models
that do not take uncertainty into account.
- Abstract(参考訳): 時間周波数領域における音声強調は、乗法マスクを推定してクリーン音声を抽出することで行われることが多い。
しかしながら、ほとんどのニューラルネットワークベースの手法は、点推定、すなわち、その出力は単一のマスクからなる。
本稿では,ニューラルネットワークに基づく音声強調における不確実性モデリングの利点について検討する。
このために、我々のニューラルネットワークは、スペクトル係数の最大 a posteriori (map) 推定に基づいて、ノイズのあったスペクトログラムをウィーナーフィルタとその関連する分散にマッピングするように訓練されている。
点推定の代わりに分布を推定することで、各推定に付随する不確かさをモデル化することができる。
さらに,推定ウィナーフィルタとその不確かさを用いて,スペクトル等級の近似写像(a-map)推定器を構築し,スペクトル係数の写像推定と組み合わせてハイブリッド損失関数を形成し,その推定を補強する。
異なるデータセットを用いた実験の結果,提案手法は推定フィルタに関する不確かさを捉えるだけでなく,不確実性を考慮していないモデルよりも高い拡張性能が得られることがわかった。
関連論文リスト
- Uncertainty Quantification With Noise Injection in Neural Networks: A Bayesian Perspective [1.6044444452278062]
ベイズの観点からノイズ注入と不確実性定量化の関連性を確立する。
本稿では,モンテカルロノイズ注入法(MCNI)を提案する。
本手法は,ベースラインモデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-01-21T17:28:52Z) - Robust Non-parametric Knowledge-based Diffusion Least Mean Squares over
Adaptive Networks [12.266804067030455]
提案アルゴリズムは, 協調推定器群における未知パラメータベクトルのロバストな推定に導かれる。
その結果,異なるノイズの種類が存在する場合,提案アルゴリズムのロバスト性を示す。
論文 参考訳(メタデータ) (2023-12-03T06:18:59Z) - Integrating Uncertainty into Neural Network-based Speech Enhancement [27.868722093985006]
時間周波数領域における監視されたマスキングアプローチは、ディープニューラルネットワークを使用して乗法マスクを推定し、クリーンな音声を抽出することを目的としている。
これにより、信頼性の保証や尺度を使わずに、各入力に対する単一の見積もりが導かれる。
クリーン音声推定における不確実性モデリングの利点について検討する。
論文 参考訳(メタデータ) (2023-05-15T15:55:12Z) - Uncertainty Estimation in Deep Speech Enhancement Using Complex Gaussian
Mixture Models [19.442685015494316]
単一チャンネルのディープ音声強調手法は、その精度を測らずにクリーン音声を抽出するために単一の乗法マスクを推定することが多い。
本稿では,ニューラルネットワークによる音声強調におけるクリーン音声推定に伴う不確かさの定量化を提案する。
論文 参考訳(メタデータ) (2022-12-09T13:03:09Z) - NUQ: Nonparametric Uncertainty Quantification for Deterministic Neural
Networks [151.03112356092575]
本研究では,Nadaraya-Watson の条件付きラベル分布の非パラメトリック推定に基づく分類器の予測の不確かさの測定方法を示す。
種々の実世界の画像データセットにおける不確実性推定タスクにおいて,本手法の強い性能を示す。
論文 参考訳(メタデータ) (2022-02-07T12:30:45Z) - Dense Uncertainty Estimation [62.23555922631451]
本稿では,ニューラルネットワークと不確実性推定手法について検討し,正確な決定論的予測と確実性推定の両方を実現する。
本研究では,アンサンブルに基づく手法と生成モデルに基づく手法の2つの不確実性推定法について検討し,それらの長所と短所を,完全/半端/弱度に制御されたフレームワークを用いて説明する。
論文 参考訳(メタデータ) (2021-10-13T01:23:48Z) - Sampling-free Variational Inference for Neural Networks with
Multiplicative Activation Noise [51.080620762639434]
サンプリングフリー変動推論のための後方近似のより効率的なパラメータ化を提案する。
提案手法は,標準回帰問題に対する競合的な結果をもたらし,大規模画像分類タスクに適している。
論文 参考訳(メタデータ) (2021-03-15T16:16:18Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。