論文の概要: DDOS: A MOS Prediction Framework utilizing Domain Adaptive Pre-training
and Distribution of Opinion Scores
- arxiv url: http://arxiv.org/abs/2204.03219v1
- Date: Thu, 7 Apr 2022 05:04:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-08 15:55:24.578124
- Title: DDOS: A MOS Prediction Framework utilizing Domain Adaptive Pre-training
and Distribution of Opinion Scores
- Title(参考訳): DDOS:ドメイン適応型事前学習とオピニオンスコアの分布を利用したMOS予測フレームワーク
- Authors: Wei-Cheng Tseng, Wei-Tsung Kao, Hung-yi Lee
- Abstract要約: MOS(Mean opinion score)は、音声合成システムにおいて典型的な主観評価尺度である。
本稿では,新しいMOS予測モデルであるDDOSを提案する。
DDOSは、ドメイン適応事前学習を利用して、合成音声の自己教師付き学習モデルをさらに訓練する。
- 参考スコア(独自算出の注目度): 64.37977826069105
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Mean opinion score (MOS) is a typical subjective evaluation metric for speech
synthesis systems. Since collecting MOS is time-consuming, it would be
desirable if there are accurate MOS prediction models for automatic evaluation.
In this work, we propose DDOS, a novel MOS prediction model. DDOS utilizes
domain adaptive pre-training to further pre-train self-supervised learning
models on synthetic speech. And a proposed module is added to model the opinion
score distribution of each utterance. With the proposed components, DDOS
outperforms previous works on BVCC dataset. And the zero shot transfer result
on BC2019 dataset is significantly improved. DDOS also wins second place in
Interspeech 2022 VoiceMOS challenge in terms of system-level score.
- Abstract(参考訳): MOS(Mean opinion score)は、音声合成システムにおいて典型的な主観評価尺度である。
MOSの収集には時間を要するため,自動評価のための正確なMOS予測モデルが存在することが望ましい。
本稿では,新しいMOS予測モデルであるDDOSを提案する。
DDOSは、ドメイン適応事前学習を利用して、合成音声の自己教師付き学習モデルをさらに訓練する。
また,各発話のスコア分布をモデル化するモジュールが提案されている。
提案されたコンポーネントでは、DDOSは以前のBVCCデータセットよりもパフォーマンスがよい。
BC2019データセットのゼロショット転送結果も大幅に改善されている。
DDOSはまた、システムレベルのスコアでInterspeech 2022 VoiceMOSチャレンジで2位を獲得した。
関連論文リスト
- MOSPC: MOS Prediction Based on Pairwise Comparison [32.55704173124071]
MOS(Mean opinion score)は、合成音声の品質を評価する主観的尺度である。
ペア比較(MOSPC)に基づくMOS予測のための一般的なフレームワークを提案する。
筆者らのフレームワークは,各きめ細かなセグメントのランキング精度において,強いベースラインを超えている。
論文 参考訳(メタデータ) (2023-06-18T07:38:17Z) - Investigating Content-Aware Neural Text-To-Speech MOS Prediction Using
Prosodic and Linguistic Features [54.48824266041105]
MOS予測ニューラルモデルに基づく自動合成音声評価の最先端手法について検討した。
MOS予測システムに付加的な入力として韻律的特徴と言語的特徴を含めることを提案する。
すべてのMOS予測システムは、クラウドソースされた自然性MOS評価を備えた、TSSのみのニューラルネットワークであるSOMOSでトレーニングされている。
論文 参考訳(メタデータ) (2022-11-01T09:18:50Z) - Improving Self-Supervised Learning-based MOS Prediction Networks [0.0]
本研究は,従来の自己教師型学習ベースMOS予測モデルに対して,データ,トレーニング,後訓練による具体的な改善を導入する。
We used a wav2vec 2.0 model pre-trained on LibriSpeech, extended with LSTM and non-linear dense layer。
この手法は,第1のVoice MOSチャレンジの共有合成音声データセットを用いて評価する。
論文 参考訳(メタデータ) (2022-04-23T09:19:16Z) - SOMOS: The Samsung Open MOS Dataset for the Evaluation of Neural
Text-to-Speech Synthesis [50.236929707024245]
SOMOSデータセットは、単にニューラルテキスト音声(TTS)サンプルからなる最初の大規模平均世論スコア(MOS)データセットである。
パブリックドメイン音声データセットであるLJ音声の合成発話20Kから成っている。
論文 参考訳(メタデータ) (2022-04-06T18:45:20Z) - LDNet: Unified Listener Dependent Modeling in MOS Prediction for
Synthetic Speech [67.88748572167309]
本稿では,平均世論スコア(MOS)予測のための統合フレームワークLDNetを提案する。
より安定した結果と効率的な計算を提供する2つの推論手法を提案する。
論文 参考訳(メタデータ) (2021-10-18T08:52:31Z) - Utilizing Self-supervised Representations for MOS Prediction [51.09985767946843]
既存の評価は通常、クリーンな参照または平行な地上真実データを必要とする。
一方、主観的テストは、追加のクリーンデータや並列データを必要としず、人間の知覚とよりよく相関する。
基礎的真理データを必要とせず,人間の知覚とよく相関する自動評価手法を開発した。
論文 参考訳(メタデータ) (2021-04-07T09:44:36Z) - Neural MOS Prediction for Synthesized Speech Using Multi-Task Learning
With Spoofing Detection and Spoofing Type Classification [16.43844160498413]
MOS予測モデルの性能向上のためのマルチタスク学習(MTL)手法を提案する。
Voice Conversion Challenge 2018を使った実験では、2つの補助タスクを備えたMTLの提案がMOS予測を改善することが示されている。
論文 参考訳(メタデータ) (2020-07-16T11:38:08Z) - Semi-Supervised Models via Data Augmentationfor Classifying Interactive
Affective Responses [85.04362095899656]
本稿では、対話型感情応答を分類する半教師付きテキスト分類システムSMDA(Data Augmentation)を提案する。
ラベル付き文に対しては,ラベル分布の均一化と学習過程における教師付き損失の計算のためにデータ拡張を行った。
ラベルなし文に対しては,ラベルなし文に対する低エントロピー予測を擬似ラベルとして検討した。
論文 参考訳(メタデータ) (2020-04-23T05:02:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。