論文の概要: Is Phase Really Needed for Weakly-Supervised Dereverberation ?
- arxiv url: http://arxiv.org/abs/2511.17346v1
- Date: Thu, 20 Nov 2025 09:14:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.097018
- Title: Is Phase Really Needed for Weakly-Supervised Dereverberation ?
- Title(参考訳): 弱スーパーバイバレーションの位相は本当に必要か?
- Authors: Marius Rodrigues, Louis Bahrman, Roland Badeau, Gaël Richard,
- Abstract要約: 非教師的あるいは弱い教師による音声の除去アプローチでは、標的の清潔な(乾いた)信号は訓練中に未知であると考えられている。
本研究は、時間周波数領域における残響相(ウェット相)の役割について検討する。
- 参考スコア(独自算出の注目度): 16.29297535427954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In unsupervised or weakly-supervised approaches for speech dereverberation, the target clean (dry) signals are considered to be unknown during training. In that context, evaluating to what extent information can be retrieved from the sole knowledge of reverberant (wet) speech becomes critical. This work investigates the role of the reverberant (wet) phase in the time-frequency domain. Based on Statistical Wave Field Theory, we show that late reverberation perturbs phase components with white, uniformly distributed noise, except at low frequencies. Consequently, the wet phase carries limited useful information and is not essential for weakly supervised dereverberation. To validate this finding, we train dereverberation models under a recent weak supervision framework and demonstrate that performance can be significantly improved by excluding the reverberant phase from the loss function.
- Abstract(参考訳): 非教師的あるいは弱い教師による音声の除去アプローチでは、標的の清潔な(乾いた)信号は訓練中に未知であると考えられている。
この文脈では、残響(ウェット)音声の唯一の知識から、どの程度の情報が得られるかを評価することが重要となる。
本研究は、時間周波数領域における残響相(ウェット相)の役割について検討する。
統計的波動場理論に基づき,低周波を除く,白色一様分布雑音の残響乱れ位相成分について検討した。
その結果、湿潤相は限られた有用な情報しか持たず、弱教師付きデリバベーションには不可欠ではない。
このことを検証するため,近年の弱い監督体制下での残響モデルを訓練し,損失関数から残響位相を除外することにより,性能を著しく向上させることができることを示した。
関連論文リスト
- Human Supervision as an Information Bottleneck: A Unified Theory of Error Floors in Human-Guided Learning [51.56484100374058]
制約は、モデルスケールや最適化よりも、監督チャネルの構造的特性を反映している、と我々は主張する。
我々は、人間の監督チャネルが潜在評価対象に十分でない場合、情報伝達チャネルとして機能することを示す統一理論を開発する。
論文 参考訳(メタデータ) (2026-02-26T19:11:32Z) - Flow Matching in the Low-Noise Regime: Pathologies and a Contrastive Remedy [19.64681328133978]
フローマッチングは、生成モデリングと表現学習のための連続時間定式化を提供する。
この枠組みは低雑音体制における根本的な不安定性に悩まされていることを示す。
直接速度回帰を小さな雑音レベルにおける対照的な特徴アライメントに置き換えるハイブリッドトレーニングプロトコルであるLocal Contrastive Flow (LCF)を提案する。
論文 参考訳(メタデータ) (2025-09-25T09:36:41Z) - U-DREAM: Unsupervised Dereverberation guided by a Reverberation Model [12.192022160630165]
本稿では,弱教師付きから完全教師なしまでの監督設定を施した最先端のデリバベーションモデルの訓練結果について検討する。
既存のディープラーニングアプローチの多くは、通常、ペア化された乾式と残響式のデータを必要とするが、実際は入手が困難である。
そこで, ディープニューラルネットワークを用いた残響入力から, 音響パラメータとドライ信号が推定される。
論文 参考訳(メタデータ) (2025-07-17T12:26:18Z) - Taking a Big Step: Large Learning Rates in Denoising Score Matching Prevent Memorization [11.088273093231324]
十分な学習率で勾配降下訓練を行うと、ニューラルネットワークは最小限の局所的な最小限に収束することができない。
実験は,1次元の設定を超えても,記憶予防において学習速度が重要な役割を担っていることを検証した。
論文 参考訳(メタデータ) (2025-02-05T18:29:35Z) - Understanding Warmup-Stable-Decay Learning Rates: A River Valley Loss Landscape Perspective [66.80315289020487]
Warmup-Stable-Decay (WSD) スケジュールは、一定の学習率を使用して、所定の計算予算なしで無限に継続できるイテレーションのメインブランチを生成する。
プレトレーニング損失は,河底に川がある深い谷に類似した河谷景観を呈することを示す。
この理論にインスパイアされたWSD-Sは、従来のチェックポイントの崩壊フェーズを再利用し、メインブランチを1つだけ保持するWSDの変種である。
論文 参考訳(メタデータ) (2024-10-07T16:49:39Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Can Active Sampling Reduce Causal Confusion in Offline Reinforcement
Learning? [58.942118128503104]
因果的混乱(英: Causal confusion)とは、エージェントがデータ中の不完全な急激な相関を反映するポリシーを学ぶ現象である。
この現象は特にロボット工学などの領域で顕著である。
本稿では,オフライン強化学習における因果的混乱について検討する。
論文 参考訳(メタデータ) (2023-12-28T17:54:56Z) - Understanding and Mitigating the Label Noise in Pre-training on
Downstream Tasks [91.15120211190519]
本稿では、事前学習データセットにおけるノイズの性質を理解し、下流タスクへの影響を軽減することを目的とする。
雑音の悪影響を軽減するために特徴空間に適応する軽量ブラックボックスチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2023-09-29T06:18:15Z) - Advancing underwater acoustic target recognition via adaptive data
pruning and smoothness-inducing regularization [27.039672355700198]
本稿では,クロスエントロピーに基づくトレーニングデータにおいて,過度に類似したセグメントを創り出す戦略を提案する。
我々はノイズの多いサンプルを生成し、KLの発散に基づくスムーズネス誘導正則化を適用し、オーバーフィッティングを緩和する。
論文 参考訳(メタデータ) (2023-04-24T08:30:41Z) - A Sober Look at the Unsupervised Learning of Disentangled
Representations and their Evaluation [63.042651834453544]
モデルとデータの両方に帰納的バイアスを伴わずに,非教師なしの非教師付き表現学習は不可能であることを示す。
異なる手法は、対応する損失によって「強化」された特性を効果的に強制するが、よく見分けられたモデルは監督なしでは特定できないように見える。
以上の結果から,遠絡学習における今後の研究は,帰納的バイアスと(単純に)監督の役割を明確化すべきであることが示唆された。
論文 参考訳(メタデータ) (2020-10-27T10:17:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。