論文の概要: Learning-free L2-Accented Speech Generation using Phonological Rules
- arxiv url: http://arxiv.org/abs/2603.07550v1
- Date: Sun, 08 Mar 2026 09:22:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.798995
- Title: Learning-free L2-Accented Speech Generation using Phonological Rules
- Title(参考訳): 音韻規則を用いた学習不要L2アクセント音声生成
- Authors: Thanathai Lertpetchpun, Yoonjeong Lee, Jihwan Lee, Tiantian Feng, Dani Byrd, Shrikanth Narayanan,
- Abstract要約: 音韻規則と多言語TSモデルを組み合わせたアクセント付きテキスト音声合成フレームワークを提案する。
これらの規則は音素系列に適用され、音素レベルでアクセントを変換する。
音韻制約から生じる子音,母音,音節構造の体系的差異をモデル化し,スペイン語およびインド英語の規則セットを設計する。
- 参考スコア(独自算出の注目度): 46.06717601946553
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accent plays a crucial role in speaker identity and inclusivity in speech technologies. Existing accented text-to-speech (TTS) systems either require large-scale accented datasets or lack fine-grained phoneme-level controllability. We propose a accented TTS framework that combines phonological rules with a multilingual TTS model. The rules are applied to phoneme sequences to transform accent at the phoneme level while preserving intelligibility. The method requires no accented training data and enables explicit phoneme-level accent manipulation. We design rule sets for Spanish- and Indian-accented English, modeling systematic differences in consonants, vowels, and syllable structure arising from phonotactic constraints. We analyze the trade-off between phoneme-level duration alignment and accent as realized in speech timing. Experimental results demonstrate effective accent shift while maintaining speech quality.
- Abstract(参考訳): アクセントは音声技術において話者識別と傾きにおいて重要な役割を担っている。
既存のアクセント付きテキスト音声(TTS)システムは、大規模なアクセント付きデータセットを必要とするか、音素レベルのきめ細かい制御性が欠けている。
音韻規則と多言語TSモデルを組み合わせたアクセント付きTSフレームワークを提案する。
これらの規則は音素系列に適用され、音素レベルでアクセントを変換する。
この方法はアクセント付き訓練データを必要とせず、明瞭な音素レベルのアクセント操作を可能にする。
音韻制約から生じる子音,母音,音節構造の体系的差異をモデル化し,スペイン語およびインド英語の規則セットを設計する。
音素レベルの持続時間アライメントとアクセントのトレードオフを音声タイミングで解析する。
音声品質を維持しながらアクセントシフトを効果的に行う実験結果を得た。
関連論文リスト
- Accent Vector: Controllable Accent Manipulation for Multilingual TTS Without Accented Data [45.10765052993173]
マルチリンガルTSにおけるアクセント操作を可能にする制御可能な表現であるtextitAccent Vectorを提案する。
textitAccent Vectorは、異なる言語の母国語でTTSシステムを微調整することによって導出される。
ベクトルのスケーリングと補間によりアクセント強度のきめ細かい制御を実現し,混合アクセント音声を生成する。
論文 参考訳(メタデータ) (2026-03-08T08:48:42Z) - Quantifying Speaker Embedding Phonological Rule Interactions in Accented Speech Synthesis [44.55147169458465]
アクセント付き音声合成における話者埋め込みと言語的に動機付けられた音韻規則の相互作用を分析する。
実験により、規則と埋め込みを組み合わせることで、より真正なアクセントが得られることが示された。
本研究は,アクセント制御のためのレバーとして,および音声生成における歪み評価のための枠組みとして,ルールを強調した。
論文 参考訳(メタデータ) (2026-01-20T19:25:33Z) - Accent conversion using discrete units with parallel data synthesized from controllable accented TTS [56.18382038512251]
アクセント変換(AC)の目的は、コンテンツと話者のアイデンティティを保ちながら、アクセントを変換することである。
従来の手法では、推論中に参照発話が必要であったり、話者のアイデンティティを十分に保持していなかったり、ネイティブでないアクセントごとにのみトレーニング可能な1対1のシステムを使用していた。
本稿では,これらの問題を克服するために,多くのアクセントをネイティブに変換する,有望なACモデルを提案する。
論文 参考訳(メタデータ) (2024-09-30T19:52:10Z) - Accent Conversion in Text-To-Speech Using Multi-Level VAE and Adversarial Training [14.323313455208183]
包括的音声技術は、特定のアクセントを持つ人々のような特定のグループに対する偏見を消すことを目的としている。
本稿では,アクセント付き音声合成と変換に逆学習を用いたマルチレベル変分オートエンコーダを用いたTSモデルを提案する。
論文 参考訳(メタデータ) (2024-06-03T05:56:02Z) - Explicit Intensity Control for Accented Text-to-speech [65.35831577398174]
TTSの過程におけるアクセントの強度の制御は、非常に興味深い研究方向である。
近年の作業は、話者とアクセント情報をアンタングルし、そのアクセント強度を制御するために損失重量を調整するために、話者対アダルロスを設計している。
本稿では,アクセント付きTSのための直感的かつ明示的なアクセント強度制御方式を提案する。
論文 参考訳(メタデータ) (2022-10-27T12:23:41Z) - Few-Shot Cross-Lingual TTS Using Transferable Phoneme Embedding [55.989376102986654]
本稿では,言語間テキスト-音声間問題に対処するための移動可能な音素埋め込みフレームワークについて,数ショット設定で検討する。
本稿では,音素ベースのTSモデルと,異なる言語からの音素を学習潜在空間に投影するコードブックモジュールからなるフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-27T11:24:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。