論文の概要: Unsupervised Noise adaptation using Data Simulation
- arxiv url: http://arxiv.org/abs/2302.11981v1
- Date: Thu, 23 Feb 2023 12:57:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-24 15:15:51.012555
- Title: Unsupervised Noise adaptation using Data Simulation
- Title(参考訳): データシミュレーションによる教師なし雑音適応
- Authors: Chen Chen, Yuchen Hu, Heqing Zou, Linhui Sun, Eng Siong Chng
- Abstract要約: 本稿では,逆クリーン・ノイズ変換を効率よく学習するための生成逆ネットワークに基づく手法を提案する。
実験結果から,本手法はトレーニングセットとテストセット間のドメインミスマッチを効果的に軽減することが示された。
- 参考スコア(独自算出の注目度): 21.866522173387715
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep neural network based speech enhancement approaches aim to learn a
noisy-to-clean transformation using a supervised learning paradigm. However,
such a trained-well transformation is vulnerable to unseen noises that are not
included in training set. In this work, we focus on the unsupervised noise
adaptation problem in speech enhancement, where the ground truth of target
domain data is completely unavailable. Specifically, we propose a generative
adversarial network based method to efficiently learn a converse clean-to-noisy
transformation using a few minutes of unpaired target domain data. Then this
transformation is utilized to generate sufficient simulated data for domain
adaptation of the enhancement model. Experimental results show that our method
effectively mitigates the domain mismatch between training and test sets, and
surpasses the best baseline by a large margin.
- Abstract(参考訳): 深層ニューラルネットワークに基づく音声強調手法は教師付き学習パラダイムを用いてノイズからクリーンへの変換を学習することを目的としている。
しかし、そのような訓練されたウェル変換は、トレーニングセットに含まれない目に見えないノイズに対して脆弱である。
本稿では,音声強調における教師なし雑音適応問題に焦点をあて,対象領域データの基底的真理が完全に利用できない場合について述べる。
具体的には,数分間の未ペア対象ドメインデータを用いて,逆クリーン・ノイズ変換を効率よく学習するための生成逆ネットワークに基づく手法を提案する。
そして、この変換を利用して、拡張モデルのドメイン適応に十分なシミュレーションデータを生成する。
実験の結果,本手法はトレーニングセットとテストセット間のドメインミスマッチを効果的に軽減し,最良ベースラインをはるかに超えることがわかった。
関連論文リスト
- Effective Noise-aware Data Simulation for Domain-adaptive Speech Enhancement Leveraging Dynamic Stochastic Perturbation [25.410770364140856]
クロスドメイン音声強調(SE)は、目に見えない対象領域におけるノイズや背景情報の不足により、しばしば深刻な課題に直面している。
本研究では,ノイズ抽出技術とGANを利用した新しいデータシミュレーション手法を提案する。
本研究では,動的摂動の概念を導入し,制御された摂動を推論中の雑音埋め込みに注入する。
論文 参考訳(メタデータ) (2024-09-03T02:29:01Z) - How to Learn in a Noisy World? Self-Correcting the Real-World Data Noise on Machine Translation [10.739338438716965]
実世界のハード・トゥ・デテクト・ミスアライメントノイズが機械翻訳に与える影響について検討する。
トークンレベルでの不整合とクリーンなデータを区別するために,モデルの自己認識の信頼性が高まるのを観察することにより,自己補正手法を提案する。
提案手法は,8つの翻訳タスクにまたがる実世界のノイズの多いWebマイニングデータセットに対して有効であることを示す。
論文 参考訳(メタデータ) (2024-07-02T12:15:15Z) - Denoising as Adaptation: Noise-Space Domain Adaptation for Image Restoration [64.84134880709625]
拡散モデルを用いて,雑音空間を介して領域適応を行うことが可能であることを示す。
特に、補助的な条件入力が多段階の復調過程にどのように影響するかというユニークな性質を活用することにより、有意義な拡散損失を導出する。
拡散モデルにおけるチャネルシャッフル層や残留スワッピング型コントラスト学習などの重要な戦略を提案する。
論文 参考訳(メタデータ) (2024-06-26T17:40:30Z) - Pivotal Auto-Encoder via Self-Normalizing ReLU [20.76999663290342]
トランスフォーメーション学習問題として,単一の隠蔽層スパースオートエンコーダを定式化する。
本稿では,テスト時の騒音レベルに不変な予測モデルを実現する最適化問題を提案する。
実験結果から, 各種ノイズに対する安定性が向上することが示唆された。
論文 参考訳(メタデータ) (2024-06-23T09:06:52Z) - Learning with Noisy Foundation Models [95.50968225050012]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - From Denoising Training to Test-Time Adaptation: Enhancing Domain
Generalization for Medical Image Segmentation [8.36463803956324]
本稿では,補助的な復号化デコーダを基本U-Netアーキテクチャに組み込んだ新しい手法であるDenoising Y-Netを提案する。
補助デコーダは、ドメインの一般化を促進するドメイン不変表現を増強し、デノナイジングトレーニングを実行することを目的としている。
そこで本研究では,Denoising Test Time Adaptation (DeTTA)を提案する。さらに, (i) モデルを対象領域にサンプル的に適応させ, (ii) ノイズ破損した入力に適応させる。
論文 参考訳(メタデータ) (2023-10-31T08:39:15Z) - Understanding and Mitigating the Label Noise in Pre-training on
Downstream Tasks [91.15120211190519]
本稿では、事前学習データセットにおけるノイズの性質を理解し、下流タスクへの影響を軽減することを目的とする。
雑音の悪影響を軽減するために特徴空間に適応する軽量ブラックボックスチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2023-09-29T06:18:15Z) - MAPS: A Noise-Robust Progressive Learning Approach for Source-Free
Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。
本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文 参考訳(メタデータ) (2023-02-09T12:06:08Z) - Improving Pre-trained Language Model Fine-tuning with Noise Stability
Regularization [94.4409074435894]
本稿では,LNSR(Layerwise Noise Stability Regularization)という,新規かつ効果的な微調整フレームワークを提案する。
具体的には、標準ガウス雑音を注入し、微調整モデルの隠れ表現を正規化することを提案する。
提案手法は,L2-SP,Mixout,SMARTなど他の最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-12T04:42:49Z) - Improving Distortion Robustness of Self-supervised Speech Processing
Tasks with Domain Adaptation [60.26511271597065]
音声歪みは、視覚的に訓練された音声処理モデルの性能を劣化させる長年の問題である。
音声処理モデルのロバスト性を向上して、音声歪みに遭遇する際の良好な性能を得るには、時間を要する。
論文 参考訳(メタデータ) (2022-03-30T07:25:52Z) - SemI2I: Semantically Consistent Image-to-Image Translation for Domain
Adaptation of Remote Sensing Data [7.577893526158495]
本稿では,新たなデータ拡張手法を提案する。
我々のセマンティックセグメンテーションフレームワークは、まず実際のトレーニングデータからU-netをトレーニングし、次に提案手法によって生成されたテストスタイル化された偽のトレーニングデータに微調整する。
論文 参考訳(メタデータ) (2020-02-14T09:07:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。