論文の概要: Is Phase Really Needed for Weakly-Supervised Dereverberation ?
- arxiv url: http://arxiv.org/abs/2511.17346v1
- Date: Thu, 20 Nov 2025 09:14:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.097018
- Title: Is Phase Really Needed for Weakly-Supervised Dereverberation ?
- Title(参考訳): 弱スーパーバイバレーションの位相は本当に必要か?
- Authors: Marius Rodrigues, Louis Bahrman, Roland Badeau, Gaël Richard,
- Abstract要約: 非教師的あるいは弱い教師による音声の除去アプローチでは、標的の清潔な(乾いた)信号は訓練中に未知であると考えられている。
本研究は、時間周波数領域における残響相(ウェット相)の役割について検討する。
- 参考スコア(独自算出の注目度): 16.29297535427954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In unsupervised or weakly-supervised approaches for speech dereverberation, the target clean (dry) signals are considered to be unknown during training. In that context, evaluating to what extent information can be retrieved from the sole knowledge of reverberant (wet) speech becomes critical. This work investigates the role of the reverberant (wet) phase in the time-frequency domain. Based on Statistical Wave Field Theory, we show that late reverberation perturbs phase components with white, uniformly distributed noise, except at low frequencies. Consequently, the wet phase carries limited useful information and is not essential for weakly supervised dereverberation. To validate this finding, we train dereverberation models under a recent weak supervision framework and demonstrate that performance can be significantly improved by excluding the reverberant phase from the loss function.
- Abstract(参考訳): 非教師的あるいは弱い教師による音声の除去アプローチでは、標的の清潔な(乾いた)信号は訓練中に未知であると考えられている。
この文脈では、残響(ウェット)音声の唯一の知識から、どの程度の情報が得られるかを評価することが重要となる。
本研究は、時間周波数領域における残響相(ウェット相)の役割について検討する。
統計的波動場理論に基づき,低周波を除く,白色一様分布雑音の残響乱れ位相成分について検討した。
その結果、湿潤相は限られた有用な情報しか持たず、弱教師付きデリバベーションには不可欠ではない。
このことを検証するため,近年の弱い監督体制下での残響モデルを訓練し,損失関数から残響位相を除外することにより,性能を著しく向上させることができることを示した。
関連論文リスト
- Flow Matching in the Low-Noise Regime: Pathologies and a Contrastive Remedy [19.64681328133978]
フローマッチングは、生成モデリングと表現学習のための連続時間定式化を提供する。
この枠組みは低雑音体制における根本的な不安定性に悩まされていることを示す。
直接速度回帰を小さな雑音レベルにおける対照的な特徴アライメントに置き換えるハイブリッドトレーニングプロトコルであるLocal Contrastive Flow (LCF)を提案する。
論文 参考訳(メタデータ) (2025-09-25T09:36:41Z) - U-DREAM: Unsupervised Dereverberation guided by a Reverberation Model [12.192022160630165]
本稿では,弱教師付きから完全教師なしまでの監督設定を施した最先端のデリバベーションモデルの訓練結果について検討する。
既存のディープラーニングアプローチの多くは、通常、ペア化された乾式と残響式のデータを必要とするが、実際は入手が困難である。
そこで, ディープニューラルネットワークを用いた残響入力から, 音響パラメータとドライ信号が推定される。
論文 参考訳(メタデータ) (2025-07-17T12:26:18Z) - Understanding Warmup-Stable-Decay Learning Rates: A River Valley Loss Landscape Perspective [66.80315289020487]
Warmup-Stable-Decay (WSD) スケジュールは、一定の学習率を使用して、所定の計算予算なしで無限に継続できるイテレーションのメインブランチを生成する。
プレトレーニング損失は,河底に川がある深い谷に類似した河谷景観を呈することを示す。
この理論にインスパイアされたWSD-Sは、従来のチェックポイントの崩壊フェーズを再利用し、メインブランチを1つだけ保持するWSDの変種である。
論文 参考訳(メタデータ) (2024-10-07T16:49:39Z) - Can Active Sampling Reduce Causal Confusion in Offline Reinforcement
Learning? [58.942118128503104]
因果的混乱(英: Causal confusion)とは、エージェントがデータ中の不完全な急激な相関を反映するポリシーを学ぶ現象である。
この現象は特にロボット工学などの領域で顕著である。
本稿では,オフライン強化学習における因果的混乱について検討する。
論文 参考訳(メタデータ) (2023-12-28T17:54:56Z) - Understanding and Mitigating the Label Noise in Pre-training on
Downstream Tasks [91.15120211190519]
本稿では、事前学習データセットにおけるノイズの性質を理解し、下流タスクへの影響を軽減することを目的とする。
雑音の悪影響を軽減するために特徴空間に適応する軽量ブラックボックスチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2023-09-29T06:18:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。