論文の概要: Accent Vector: Controllable Accent Manipulation for Multilingual TTS Without Accented Data
- arxiv url: http://arxiv.org/abs/2603.07534v1
- Date: Sun, 08 Mar 2026 08:48:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.786811
- Title: Accent Vector: Controllable Accent Manipulation for Multilingual TTS Without Accented Data
- Title(参考訳): アクセントベクトル:アクセントデータのない多言語TSのための制御可能なアクセント操作
- Authors: Thanathai Lertpetchpun, Thanapat Trachu, Jihwan Lee, Tiantian Feng, Dani Byrd, Shrikanth Narayanan,
- Abstract要約: マルチリンガルTSにおけるアクセント操作を可能にする制御可能な表現であるtextitAccent Vectorを提案する。
textitAccent Vectorは、異なる言語の母国語でTTSシステムを微調整することによって導出される。
ベクトルのスケーリングと補間によりアクセント強度のきめ細かい制御を実現し,混合アクセント音声を生成する。
- 参考スコア(独自算出の注目度): 45.10765052993173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accent is an integral part of society, reflecting multiculturalism and shaping how individuals express identity. The majority of English speakers are non-native (L2) speakers, yet current Text-To-Speech (TTS) systems primarily model American-accented English due limited accented data. We propose \textit{Accent Vector}, a controllable representation that enables accent manipulation in multilingual TTS without requiring accented training data. \textit{Accent Vector} is derived by fine-tuning a TTS system on native speech of a different language (i.e. non-English) and computing task vectors capturing accent characteristics (i.e. in English). By scaling and interpolating the vector, we achieve fine-grained control over accent strength and generate mixed-accent speech. In addition, it generalizes beyond English, enabling accent control across multiple languages. Objective and human evaluations confirm the effectiveness of Accent Vector for fine-grained and compositional accent control.
- Abstract(参考訳): アクセントは社会の不可欠な部分であり、多文化主義を反映し、個人がアイデンティティを表現する方法を形成する。
英語話者の大半は、非ネイティブ(L2)話者であるが、現在のText-To-Speech(TTS)システムは、アクセント付きデータに制限のある英語を主にモデル化している。
アクセント付き学習データを必要としない多言語TSにおけるアクセント操作を可能にする制御可能な表現である「textit{Accent Vector}」を提案する。
\textit{Accent Vector} は、異なる言語(非英語)の母語にTSSシステムを微調整し、アクセント特性(英語)をキャプチャするタスクベクトルを演算することで得られる。
ベクトルのスケーリングと補間によりアクセント強度のきめ細かい制御を実現し,混合アクセント音声を生成する。
さらに、英語を超えて一般化し、複数の言語でアクセント制御を可能にする。
客観的および人的評価は、微粒化および構成的アクセント制御におけるアクセントベクトルの有効性を確認する。
関連論文リスト
- Learning-free L2-Accented Speech Generation using Phonological Rules [46.06717601946553]
音韻規則と多言語TSモデルを組み合わせたアクセント付きテキスト音声合成フレームワークを提案する。
これらの規則は音素系列に適用され、音素レベルでアクセントを変換する。
音韻制約から生じる子音,母音,音節構造の体系的差異をモデル化し,スペイン語およびインド英語の規則セットを設計する。
論文 参考訳(メタデータ) (2026-03-08T09:22:55Z) - Accent conversion using discrete units with parallel data synthesized from controllable accented TTS [56.18382038512251]
アクセント変換(AC)の目的は、コンテンツと話者のアイデンティティを保ちながら、アクセントを変換することである。
従来の手法では、推論中に参照発話が必要であったり、話者のアイデンティティを十分に保持していなかったり、ネイティブでないアクセントごとにのみトレーニング可能な1対1のシステムを使用していた。
本稿では,これらの問題を克服するために,多くのアクセントをネイティブに変換する,有望なACモデルを提案する。
論文 参考訳(メタデータ) (2024-09-30T19:52:10Z) - Accent Conversion in Text-To-Speech Using Multi-Level VAE and Adversarial Training [14.323313455208183]
包括的音声技術は、特定のアクセントを持つ人々のような特定のグループに対する偏見を消すことを目的としている。
本稿では,アクセント付き音声合成と変換に逆学習を用いたマルチレベル変分オートエンコーダを用いたTSモデルを提案する。
論文 参考訳(メタデータ) (2024-06-03T05:56:02Z) - Accented Speech Recognition With Accent-specific Codebooks [53.288874858671576]
音声アクセントは最先端の自動音声認識(ASR)システムに重大な課題をもたらす。
あまり表現されないアクセントによる性能低下は、ASRの包括的採用に対する深刻な抑止力である。
トレーニング可能なコードブックを用いたクロスアテンションを用いた,エンドツーエンドのASRシステムに対するアクセント適応手法を提案する。
論文 参考訳(メタデータ) (2023-10-24T16:10:58Z) - Multilingual Multiaccented Multispeaker TTS with RADTTS [21.234787964238645]
RADTTSに基づく多言語・多言語・多話者音声合成モデルを提案する。
7つのアクセントからなるオープンソースデータセットにおいて、任意の話者に対して合成アクセントを制御する能力を示す。
論文 参考訳(メタデータ) (2023-01-24T22:39:04Z) - Explicit Intensity Control for Accented Text-to-speech [65.35831577398174]
TTSの過程におけるアクセントの強度の制御は、非常に興味深い研究方向である。
近年の作業は、話者とアクセント情報をアンタングルし、そのアクセント強度を制御するために損失重量を調整するために、話者対アダルロスを設計している。
本稿では,アクセント付きTSのための直感的かつ明示的なアクセント強度制御方式を提案する。
論文 参考訳(メタデータ) (2022-10-27T12:23:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。