論文の概要: Parametric Representation for Singing Voice Synthesis: a Comparative
Evaluation
- arxiv url: http://arxiv.org/abs/2006.04142v1
- Date: Sun, 7 Jun 2020 13:06:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 08:32:15.409512
- Title: Parametric Representation for Singing Voice Synthesis: a Comparative
Evaluation
- Title(参考訳): 歌声合成のためのパラメトリック表現:比較評価
- Authors: Onur Babacan, Thomas Drugman, Tuomo Raitio, Daniel Erro, Thierry
Dutoit
- Abstract要約: まず,統計的パラメトリック合成に適した4つの既存手法に対して比較主観評価を行う。
ハイピッチ音声で発生するアーティファクトについて論じ,それを克服するためのアプローチを提案する。
- 参考スコア(独自算出の注目度): 10.37199090634032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various parametric representations have been proposed to model the speech
signal. While the performance of such vocoders is well-known in the context of
speech processing, their extrapolation to singing voice synthesis might not be
straightforward. The goal of this paper is twofold. First, a comparative
subjective evaluation is performed across four existing techniques suitable for
statistical parametric synthesis: traditional pulse vocoder, Deterministic plus
Stochastic Model, Harmonic plus Noise Model and GlottHMM. The behavior of these
techniques as a function of the singer type (baritone, counter-tenor and
soprano) is studied. Secondly, the artifacts occurring in high-pitched voices
are discussed and possible approaches to overcome them are suggested.
- Abstract(参考訳): 音声信号のモデル化に様々なパラメトリック表現が提案されている。
このようなボコーダのパフォーマンスは音声処理の文脈でよく知られているが、歌声合成への外挿は単純ではないかもしれない。
この論文の目標は二つある。
まず,従来のパルスボコーダ,決定論的+確率的モデル,高調波+雑音モデル,GlottHMMという,統計的パラメトリック合成に適した4つの手法の比較主観評価を行った。
シンガータイプ(バリトン,カウンターテナー,ソプラノ)の機能としてのこれらの手法の挙動について検討した。
第二に, ハイピッチ音声で発生するアーチファクトについて考察し, 克服するためのアプローチを提案する。
関連論文リスト
- Hierarchical Generative Modeling of Melodic Vocal Contours in Hindustani Classical Music [3.491362957652171]
音声録音から抽出した歌手の発声旋律の生成モデルに焦点をあてる。
本稿では,ピッチ輪郭生成モデルとピッチ輪郭合成モデルからなるモジュール型2層階層GaMaDHaNiを提案する。
論文 参考訳(メタデータ) (2024-08-22T18:04:29Z) - End-to-End Real-World Polyphonic Piano Audio-to-Score Transcription with Hierarchical Decoding [4.604877755214193]
既存のピアノA2Sシステムは、合成データのみで訓練され、評価されている。
楽譜の階層構造に整合した階層デコーダを用いたシーケンス・ツー・シーケンス(Seq2Seq)モデルを提案する。
本研究では,合成音声上での表現的パフォーマンスレンダリングシステムを用いてモデルを事前学習する2段階学習手法を提案し,続いて人間の演奏記録を用いてモデルを微調整する。
論文 参考訳(メタデータ) (2024-05-22T10:52:04Z) - High-Fidelity Speech Synthesis with Minimal Supervision: All Using
Diffusion Models [56.00939852727501]
最小教師付き音声合成は、2種類の離散音声表現を組み合わせることでTSを分離する。
非自己回帰フレームワークは、制御可能性を高め、持続拡散モデルは、多様化された韻律表現を可能にする。
論文 参考訳(メタデータ) (2023-09-27T09:27:03Z) - Enhancing the vocal range of single-speaker singing voice synthesis with
melody-unsupervised pre-training [82.94349771571642]
本研究では, メロディ非教師型マルチスピーカ事前学習法を提案し, シングルスピーカの発声域を拡大する。
合成音声のリズム自然性を改善するために、識別可能な持続時間調整器を導入するのは、これが初めてである。
実験により,提案したSVSシステムは,音質と自然性の両方において,ベースラインよりも優れていることを確認した。
論文 参考訳(メタデータ) (2023-09-01T06:40:41Z) - Towards Improving the Expressiveness of Singing Voice Synthesis with
BERT Derived Semantic Information [51.02264447897833]
本稿では、変換器(BERT)から派生したセマンティック埋め込みから双方向エンコーダ表現を用いた、エンドツーエンドの高品質な歌声合成(SVS)システムを提案する。
提案したSVSシステムは、高品質なVISingerで歌声を生成することができる。
論文 参考訳(メタデータ) (2023-08-31T16:12:01Z) - Make-A-Voice: Unified Voice Synthesis With Discrete Representation [77.3998611565557]
Make-A-Voiceは、個別表現から音声信号を合成・操作するための統合されたフレームワークである。
我々は,Make-A-Voiceは,競合するベースラインモデルと比較して,音質とスタイルの類似性が優れていることを示す。
論文 参考訳(メタデータ) (2023-05-30T17:59:26Z) - Speaker Adaption with Intuitive Prosodic Features for Statistical
Parametric Speech Synthesis [50.5027550591763]
統計的パラメトリック音声合成のための直感的な韻律特徴を持つ話者適応法を提案する。
直感的な韻律的特徴は発話レベルまたは話者レベルで抽出され、それぞれ既存の話者エンコーディングベースおよび話者エンベディングベース適応フレームワークに統合される。
論文 参考訳(メタデータ) (2022-03-02T09:00:31Z) - Learning Joint Articulatory-Acoustic Representations with Normalizing
Flows [7.183132975698293]
可逆ニューラルネットワークモデルを用いて母音の調音領域と音響領域の結合潜時表現を求める。
提案手法は調音から音響へのマッピングと音響から調音へのマッピングの両方を実現し,両領域の同時符号化の実現に成功していることを示す。
論文 参考訳(メタデータ) (2020-05-16T04:34:36Z) - VaPar Synth -- A Variational Parametric Model for Audio Synthesis [78.3405844354125]
本稿では,条件付き変分オートエンコーダ(CVAE)を用いた変分パラメトリックシンセサイザVaPar Synthを提案する。
提案するモデルの性能は,ピッチを柔軟に制御した楽器音の再構成と生成によって実証する。
論文 参考訳(メタデータ) (2020-03-30T16:05:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。