論文の概要: Extending DNN-based Multiplicative Masking to Deep Subband Filtering for
Improved Dereverberation
- arxiv url: http://arxiv.org/abs/2303.00529v3
- Date: Wed, 31 May 2023 08:45:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 03:01:01.535207
- Title: Extending DNN-based Multiplicative Masking to Deep Subband Filtering for
Improved Dereverberation
- Title(参考訳): dnnに基づく乗法マスキングのディープサブバンドフィルタへの拡張による残響改善
- Authors: Jean-Marie Lemercier, Julian Tobergte, Timo Gerkmann
- Abstract要約: 本稿では、時間周波数領域における音声復元のためのディープサブバンドフィルタにディープニューラルネットワークに基づく乗算マスクを拡張させる手法を提案する。
得られた方法は、時間周波数領域のマスクを提供するディープニューラルネットワークに汎用的に適用することができる。
- 参考スコア(独自算出の注目度): 15.16865739526702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a scheme for extending deep neural network-based
multiplicative maskers to deep subband filters for speech restoration in the
time-frequency domain. The resulting method can be generically applied to any
deep neural network providing masks in the time-frequency domain, while
requiring only few more trainable parameters and a computational overhead that
is negligible for state-of-the-art neural networks. We demonstrate that the
resulting deep subband filtering scheme outperforms multiplicative masking for
dereverberation, while leaving the denoising performance virtually the same. We
argue that this is because deep subband filtering in the time-frequency domain
fits the subband approximation often assumed in the dereverberation literature,
whereas multiplicative masking corresponds to the narrowband approximation
generally employed for denoising.
- Abstract(参考訳): 本稿では、時間周波数領域における音声復元のためのディープサブバンドフィルタにディープニューラルネットワークに基づく乗算マスクを拡張させる手法を提案する。
得られた方法は、時間周波数領域にマスクを提供する任意のディープニューラルネットワークに汎用的に適用できるが、トレーニング可能なパラメータと、最先端のニューラルネットワークでは無視できる計算オーバーヘッドは少ない。
その結果, ディープサブバンドフィルタ方式は, 除音性能をほぼ同等に保ちながら, 除音用乗算マスクよりも優れることを示した。
これは、時間周波数領域の深いサブバンドフィルタリングが、非残響の文献でしばしば想定されるサブバンド近似に適合するのに対し、乗法的マスキングは一般に分極に使用される狭帯域近似に対応するためである。
関連論文リスト
- BANF: Band-limited Neural Fields for Levels of Detail Reconstruction [28.95113960996025]
簡単な修正により、低域通過フィルタのニューラルネットワークが得られることを示すとともに、これをどのように利用して信号全体の周波数分解を得ることができるかを示す。
本研究では,提案手法の妥当性について検討し,粗い表現を効果的に計算する方法を示す。
論文 参考訳(メタデータ) (2024-04-19T17:39:50Z) - Layer Ensembles [95.42181254494287]
本稿では,ネットワークの各層に対する独立なカテゴリ分布の集合を考慮した不確実性推定手法を提案する。
その結果,メモリと実行時間が少なくなるモデルが得られた。
論文 参考訳(メタデータ) (2022-10-10T17:52:47Z) - Robust Real-World Image Super-Resolution against Adversarial Attacks [115.04009271192211]
準知覚不可能な雑音を持つ逆画像サンプルは、深層学習SRモデルを脅かす可能性がある。
本稿では,現実のSRに対して,潜在的な敵対的雑音をランダムに消去する頑健なディープラーニングフレームワークを提案する。
提案手法は敵攻撃に敏感であり,既存のモデルや防御よりも安定なSR結果を示す。
論文 参考訳(メタデータ) (2022-07-31T13:26:33Z) - A neural network-supported two-stage algorithm for lightweight
dereverberation on hearing devices [13.49645012479288]
本稿では,2段階の軽量オンライン補聴器のオンライン補聴アルゴリズムについて述べる。
このアプローチは、マルチチャネルのマルチフレーム線形フィルタとシングルチャネルのシングルフレームポストフィルタを組み合わせる。
どちらのコンポーネントも、ディープニューラルネットワーク(DNN)によって提供されるパワースペクトル密度(PSD)の推定に依存している。
論文 参考訳(メタデータ) (2022-04-06T11:08:28Z) - DeepFilterNet: A Low Complexity Speech Enhancement Framework for
Full-Band Audio based on Deep Filtering [9.200520879361916]
ディープフィルタを利用した2段階音声強調フレームワークDeepFilterNetを提案する。
まず、人間の周波数知覚をモデル化したERBスケールゲインを用いてスペクトルエンベロープを強化する。
第2段階では、音声の周期的成分を高めるためにディープフィルタリングを用いる。
論文 参考訳(メタデータ) (2021-10-11T20:03:52Z) - Unsharp Mask Guided Filtering [53.14430987860308]
本論文の目的は,フィルタ中の構造伝達の重要性を強調した画像フィルタリングである。
アンシャープマスキングにインスパイアされたガイドフィルタの新しい簡易な定式化を提案する。
我々の定式化は低域フィルタに先立ってフィルタを楽しみ、単一の係数を推定することで明示的な構造伝達を可能にする。
論文 参考訳(メタデータ) (2021-06-02T19:15:34Z) - Deep Unfolded Recovery of Sub-Nyquist Sampled Ultrasound Image [94.42139459221784]
本稿では,ISTAアルゴリズムの展開に基づく時空間領域におけるサブNyquistサンプルからの再構成手法を提案する。
本手法は,高品質な撮像性能を確保しつつ,配列要素数,サンプリングレート,計算時間を削減できる。
論文 参考訳(メタデータ) (2021-03-01T19:19:38Z) - On Filter Generalization for Music Bandwidth Extension Using Deep Neural
Networks [0.40611352512781856]
ディープニューラルネットワークを用いて帯域幅拡張問題を定式化し、帯域幅制限信号がネットワークへの入力として提供される。
本研究の主な貢献は,ネットワークのトレーニングおよびテストにおいて,低域通過フィルタの選択が与える影響である。
本稿では,トレーニング中に複数の低域通過フィルタを利用するデータ拡張戦略を提案する。
論文 参考訳(メタデータ) (2020-11-14T11:41:28Z) - ESPN: Extremely Sparse Pruned Networks [50.436905934791035]
簡単な反復マスク探索法により,非常に深いネットワークの最先端の圧縮を実現することができることを示す。
本アルゴリズムは,シングルショット・ネットワーク・プルーニング法とロッテ・ティケット方式のハイブリッド・アプローチを示す。
論文 参考訳(メタデータ) (2020-06-28T23:09:27Z) - Sparse Mixture of Local Experts for Efficient Speech Enhancement [19.645016575334786]
本稿では,専門的ニューラルネットワークの効率的なアンサンブルを通して,音声を聴覚的に認識するためのディープラーニング手法について検討する。
タスクを重複しないサブプロブレムに分割することで、計算複雑性を低減しつつ、デノナイジング性能を向上させることができる。
以上の結果から,微調整されたアンサンブルネットワークは,一般のネットワークの発声能力を上回ることができることがわかった。
論文 参考訳(メタデータ) (2020-05-16T23:23:22Z) - ADRN: Attention-based Deep Residual Network for Hyperspectral Image
Denoising [52.01041506447195]
ノイズの多いHSIからクリーンなHSIへのマッピングを学習するために,注目に基づくディープ残差ネットワークを提案する。
実験の結果,提案手法は定量的および視覚的評価において最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-04T08:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。