論文の概要: A Two-Stage Hierarchical Deep Filtering Framework for Real-Time Speech Enhancement
- arxiv url: http://arxiv.org/abs/2506.01023v1
- Date: Sun, 01 Jun 2025 14:09:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.899165
- Title: A Two-Stage Hierarchical Deep Filtering Framework for Real-Time Speech Enhancement
- Title(参考訳): リアルタイム音声強調のための2段階階層型深層フィルタリングフレームワーク
- Authors: Shenghui Lu, Hukai Huang, Jinanglong Yao, Kaidi Wang, Qingyang Hong, Lin Li,
- Abstract要約: 本稿では、サブバンド処理とディープフィルタリングを統合して、ターゲット時間周波数(TF)ビンとその周辺TFビンからの情報を利用して、単一チャネル音声強調を行うモデルを提案する。
サブバンドモジュールは、入力時の周辺周波数ビン情報をキャプチャし、ディープフィルタリングモジュールは、ターゲットTFビンとその周辺TFビンの両方に出力にフィルタリングを適用する。
- 参考スコア(独自算出の注目度): 12.634298353225455
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a model that integrates sub-band processing and deep filtering to fully exploit information from the target time-frequency (TF) bin and its surrounding TF bins for single-channel speech enhancement. The sub-band module captures surrounding frequency bin information at the input, while the deep filtering module applies filtering at the output to both the target TF bin and its surrounding TF bins. To further improve the model performance, we decouple deep filtering into temporal and frequency components and introduce a two-stage framework, reducing the complexity of filter coefficient prediction at each stage. Additionally, we propose the TAConv module to strengthen convolutional feature extraction. Experimental results demonstrate that the proposed hierarchical deep filtering network (HDF-Net) effectively utilizes surrounding TF bin information and outperforms other advanced systems while using fewer resources.
- Abstract(参考訳): 本稿では、サブバンド処理とディープフィルタリングを統合して、ターゲット時間周波数(TF)ビンとその周辺TFビンからの情報を完全に活用して、単一チャネル音声強調を行うモデルを提案する。
サブバンドモジュールは、入力時の周辺周波数ビン情報をキャプチャし、ディープフィルタリングモジュールは、ターゲットTFビンとその周辺TFビンの両方に出力にフィルタリングを適用する。
モデル性能をさらに向上するため、深層フィルタを時間および周波数成分に分離し、2段階のフレームワークを導入し、各段階におけるフィルタ係数予測の複雑さを低減した。
さらに,畳み込み特徴抽出を強化するためのTAConvモジュールを提案する。
実験により,提案した階層型深層フィルタリングネットワーク (HDF-Net) は,TF bin 情報を有効利用し,資源を減らしながら,他の先進システムより優れていることを示した。
関連論文リスト
- Understanding Dataset Distillation via Spectral Filtering [69.07076441512612]
多様なDD目標を統一するスペクトルフィルタリングフレームワークであるUniDDを紹介する。
UniDDは、DDの本質が基本的に周波数固有の特徴に合致していることを明らかにする。
この制限に対処するため,低周波情報と高周波情報の両方をカバーするためにフィルタパラメータを徐々に調整するCFM(Curriculum Frequency Matching)を提案する。
論文 参考訳(メタデータ) (2025-03-03T06:22:34Z) - FilterNet: Harnessing Frequency Filters for Time Series Forecasting [34.83702192033196]
FilterNetは、時系列信号の特定の成分を選択的に通過または減衰させることにより、重要な情報的時間パターンを抽出するために、我々の提案した学習可能な周波数フィルタ上に構築されている。
2つのフィルタを備えることで、FilterNetは、時系列文学で広く採用されている線形およびアテンションマッピングを概ねサロゲートすることができる。
論文 参考訳(メタデータ) (2024-11-03T16:20:41Z) - Multi-Mode Array Filtering of Resonance Fluorescence [0.0]
本稿では,周波数フィルタによる光子相関の測定と計算のための新しい周波数フィルタ法を提案する。
モード依存位相変調を導入することで、ほぼ矩形周波数応答を生成する。
単モードおよび多モードアレイフィルタによる2階自動・相互相関関数の結果について述べる。
論文 参考訳(メタデータ) (2024-05-06T23:07:19Z) - Filter Pruning for Efficient CNNs via Knowledge-driven Differential
Filter Sampler [103.97487121678276]
フィルタプルーニングは同時に計算を加速し、CNNのメモリオーバーヘッドを低減する。
本稿では,MFM(Masked Filter Modeling)フレームワークを用いた知識駆動型微分フィルタサンプリング(KDFS)を提案する。
論文 参考訳(メタデータ) (2023-07-01T02:28:41Z) - Focus Your Attention (with Adaptive IIR Filters) [62.80628327613344]
本稿では2次インパルス応答(IIR)フィルタを用いて入力シーケンスを動的に処理する新しい層を提案する。
比較的低次であるにもかかわらず、因果適応フィルタは関連する配列要素に注目することが示されている。
論文 参考訳(メタデータ) (2023-05-24T09:42:30Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - DeepFilterNet: A Low Complexity Speech Enhancement Framework for
Full-Band Audio based on Deep Filtering [9.200520879361916]
ディープフィルタを利用した2段階音声強調フレームワークDeepFilterNetを提案する。
まず、人間の周波数知覚をモデル化したERBスケールゲインを用いてスペクトルエンベロープを強化する。
第2段階では、音声の周期的成分を高めるためにディープフィルタリングを用いる。
論文 参考訳(メタデータ) (2021-10-11T20:03:52Z) - Unsharp Mask Guided Filtering [53.14430987860308]
本論文の目的は,フィルタ中の構造伝達の重要性を強調した画像フィルタリングである。
アンシャープマスキングにインスパイアされたガイドフィルタの新しい簡易な定式化を提案する。
我々の定式化は低域フィルタに先立ってフィルタを楽しみ、単一の係数を推定することで明示的な構造伝達を可能にする。
論文 参考訳(メタデータ) (2021-06-02T19:15:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。