論文の概要: On the Relationship between Accent Strength and Articulatory Features
- arxiv url: http://arxiv.org/abs/2507.03149v1
- Date: Thu, 03 Jul 2025 20:08:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.595234
- Title: On the Relationship between Accent Strength and Articulatory Features
- Title(参考訳): アクセント強度と構音特徴の関係について
- Authors: Kevin Huang, Sean Foley, Jihwan Lee, Yoonjeong Lee, Dani Byrd, Shrikanth Narayanan,
- Abstract要約: 本稿では,アクセント強度と音響音声から推定される調音特徴との関係について検討する。
提案フレームワークは,近年の自己教師付き学習の調音反転手法を利用して,調音特徴を推定する。
その結果,舌の位置決めパターンは2つの方言を区別することが明らかとなった。
- 参考スコア(独自算出の注目度): 26.865464238029748
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper explores the relationship between accent strength and articulatory features inferred from acoustic speech. To quantify accent strength, we compare phonetic transcriptions with transcriptions based on dictionary-based references, computing phoneme-level difference as a measure of accent strength. The proposed framework leverages recent self-supervised learning articulatory inversion techniques to estimate articulatory features. Analyzing a corpus of read speech from American and British English speakers, this study examines correlations between derived articulatory parameters and accent strength proxies, associating systematic articulatory differences with indexed accent strength. Results indicate that tongue positioning patterns distinguish the two dialects, with notable differences inter-dialects in rhotic and low back vowels. These findings contribute to automated accent analysis and articulatory modeling for speech processing applications.
- Abstract(参考訳): 本稿では,アクセント強度と音響音声から推定される調音特徴との関係について検討する。
アクセント強度を定量化するため,アクセント強度の尺度として,辞書ベースの基準に基づく音素転写と比較し,音素レベル差を計算した。
提案フレームワークは,近年の自己教師付き学習の調音反転手法を利用して,調音特徴を推定する。
本研究は、アメリカ英語話者とイギリス英語話者の読み上げ音声のコーパスを分析し、派生調音パラメータとアクセント強度の相関について検討し、アクセント強度と体系的調音差を関連づけた。
その結果,舌の位置決めパターンは2つの方言を区別することが明らかとなった。
これらの知見は,音声処理アプリケーションにおけるアクセントの自動解析と調音モデリングに寄与する。
関連論文リスト
- Probing for Phonology in Self-Supervised Speech Representations: A Case Study on Accent Perception [0.8624680612413766]
本研究では,音韻的特徴レベルの変化が音節アクセントの知覚にどのように影響するかを検討する。
本研究は,ヒンディー語母語話者の英語で一意に生成する,ラビオ・アポキシマント,ラピオ・タップ,レトロフレックス・ストップの3つのセグメントに着目した。
論文 参考訳(メタデータ) (2025-06-21T01:44:19Z) - Languages in Multilingual Speech Foundation Models Align Both Phonetically and Semantically [58.019484208091534]
事前訓練された言語モデル(LM)における言語間アライメントは、テキストベースのLMの効率的な転送を可能にしている。
テキストに基づく言語間アライメントの発見と手法が音声に適用されるかどうかについては、未解決のままである。
論文 参考訳(メタデータ) (2025-05-26T07:21:20Z) - Pairwise Evaluation of Accent Similarity in Speech Synthesis [11.513055793492418]
アクセント類似度に対する主観的評価法と客観的評価法の両方を強化することを目的としている。
我々は、より少ないリスナーと低コストで高い統計的重要性を実現するコンポーネントを追加することで、XABリスニングテストの洗練を図る。
母音フォルマントと音韻後生音との距離に基づいて発音関連指標を用いてアクセント生成を評価する。
論文 参考訳(メタデータ) (2025-05-20T14:23:50Z) - Speech Rhythm-Based Speaker Embeddings Extraction from Phonemes and
Phoneme Duration for Multi-Speaker Speech Synthesis [16.497022070614236]
本稿では,ターゲット話者による発話数を用いて,音素長をモデル化するための音声リズムに基づく話者埋め込み手法を提案する。
提案手法の新たな特徴は、音素とその持続時間から抽出されたリズムに基づく埋め込みであり、発声リズムに関連することが知られている。
論文 参考訳(メタデータ) (2024-02-11T02:26:43Z) - Explicit Intensity Control for Accented Text-to-speech [65.35831577398174]
TTSの過程におけるアクセントの強度の制御は、非常に興味深い研究方向である。
近年の作業は、話者とアクセント情報をアンタングルし、そのアクセント強度を制御するために損失重量を調整するために、話者対アダルロスを設計している。
本稿では,アクセント付きTSのための直感的かつ明示的なアクセント強度制御方式を提案する。
論文 参考訳(メタデータ) (2022-10-27T12:23:41Z) - Automatic Dialect Density Estimation for African American English [74.44807604000967]
アフリカ・アメリカン・イングリッシュ(AAE)方言の方言密度の自動予測について検討する。
方言密度は、非標準方言の特徴を含む発話における単語の割合として定義される。
このデータベースでは,AAE音声に対する予測された真理弁証密度と地上の真理弁証密度との間に有意な相関関係を示す。
論文 参考訳(メタデータ) (2022-04-03T01:34:48Z) - Deep Neural Convolutive Matrix Factorization for Articulatory
Representation Decomposition [48.56414496900755]
この研究は、コンボリューティブスパース行列分解のニューラル実装を用いて、調音データを解釈可能なジェスチャーとジェスチャースコアに分解する。
音素認識実験も実施され、ジェスチャースコアが実際に音韻情報のコード化に成功していることが示された。
論文 参考訳(メタデータ) (2022-04-01T14:25:19Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Deep Learning for Prominence Detection in Children's Read Speech [13.041607703862724]
子どもの読書記録のラベル付きデータセットを,話者に依存しない著名単語の検出のために検討する。
事前調整されたランダムフォレストアンサンブル予測器をRNNシーケンスに置き換え、潜在的なコンテキスト依存性を利用する。
深層学習を用いて、基本周波数、強度、スペクトル形状の低レベル音響輪郭から単語レベル特徴を得る。
論文 参考訳(メタデータ) (2021-04-12T14:15:08Z) - An Overview of Deep-Learning-Based Audio-Visual Speech Enhancement and
Separation [57.68765353264689]
音声強調と音声分離は関連する2つの課題である。
伝統的に、これらのタスクは信号処理と機械学習技術を使って取り組まれてきた。
ディープラーニングは強力なパフォーマンスを達成するために利用されています。
論文 参考訳(メタデータ) (2020-08-21T17:24:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。