論文の概要: Measurement of the Granularity of Vowel Production Space By Just Producible Different (JPD) Limens
- arxiv url: http://arxiv.org/abs/2507.02744v1
- Date: Thu, 03 Jul 2025 16:04:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:16.577715
- Title: Measurement of the Granularity of Vowel Production Space By Just Producible Different (JPD) Limens
- Title(参考訳): 再現性差分(JPD)による母音生産空間の粒度測定
- Authors: Peter Viechnicki,
- Abstract要約: JPD(Just Producible difference)とは、2つの母音刺激の距離のことである。
F1 X F2 空間では 14 から 51 メルと推定される。
この発見は、音声生成のエピソード理論に影響を及ぼす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: A body of work over the past several decades has demonstrated that the complex and coordinated articulatory movements of human vowel production are governed (at least in part)by control mechanisms whose targets are regions of auditory space. Within the target region control at the sub-phonemic level has also been demonstrated. But the degree of accuracy of that control is unknown. The current work investigates this question by asking how far apart must two vowel stimuli lie in auditory space in order to yield reliably different imitations? This distance is termed 'Just Producible Difference' (JPD). The current study uses a vowel mimicry paradigm to derive the first measurement of JPD among two sets of English speakers during front vowel production. JPD is estimated at between 14 and 51 mels in F1 X F2 space. This finding has implications for episodic theories of speech production. It also clarifies the possible structures of human vowel systems, by setting a theoretical lower bound for how close two vowel phonemes may be in a speaker's formant space, and hence a psychophysical explanation of observed trends in number and patterns of possible vowel phonemes.
- Abstract(参考訳): 過去数十年にわたる研究で、人間の母音生成の複雑な調音運動が(少なくとも一部は)聴覚空間の領域である制御機構によって支配されていることが示されている。
サブ音素レベルにおけるターゲット領域制御も実証されている。
しかし、その制御の正確性は不明である。
現在の研究は、2つの母音刺激が確実に異なる模倣を生み出すために、聴覚空間にどれくらい離れてあるべきかを問うことでこの問題を調査している。
この距離を「Just Producible difference」(JPD)と呼ぶ。
本研究は、前母音生成中の2組の英語話者間でJPDを初めて測定するために、母音模倣パラダイムを用いている。
JPD は F1 X F2 空間で 14 から 51 メルと推定される。
この発見は、音声生成のエピソード理論に影響を及ぼす。
また、2つの母音音素が話者のフォルマント空間にどのように近接しているかの理論的な下界を設定し、それ故に観測された母音音素の数とパターンの傾向を心理物理学的に説明することによって、人間の母音体系の可能な構造を明らかにする。
関連論文リスト
- Quantification of Tenseness in English and Japanese Tense-Lax Vowels: A Lagrangian Model with Indicator θ1 and Force of Tenseness Ftense(t) [0.0]
閉母音の調音における舌と顎の動的相互作用を記述するためのラグランジアン方程式に基づくモデルを提案する。
このモデルは、異なる言語間で母音生成に関わる力を推定するための理論的枠組みを提供する。
論文 参考訳(メタデータ) (2025-03-05T17:22:33Z) - Towards a dynamical model of English vowels. Evidence from diphthongisation [2.624902795082451]
ディフソン母音は固有の動的変化の度合いを示し、その程度は同期的にも発音的にも変化する。
この種の変化をモデル化するには、モノフソンと反対にディフソンを定義する必要がある。
両音節母音が調音的視点からコヒーレントな音声カテゴリーを形成するか否かを考察する。
論文 参考訳(メタデータ) (2024-08-30T22:10:19Z) - Language Proficiency and F0 Entrainment: A Study of L2 English Imitation in Italian, French, and Slovak Speakers [48.3822861675732]
本研究は、第2言語(L2)における第2言語(ART)のF0エントレメントについて検討する。
イタリア語、フランス語、スロバキア原語の参加者は、英語の発声を模倣しました。
その結果,L2英語の習熟度とエントレメントの関係は曖昧であった。
論文 参考訳(メタデータ) (2024-04-16T10:10:19Z) - The Hidden Dance of Phonemes and Visage: Unveiling the Enigmatic Link
between Phonemes and Facial Features [27.89284938655708]
この研究は、音素と顔の特徴の巧妙なリンクを明らかにする。
生理学的観点から見ると、音声の各部分(音素)は、顔の様々な種類の気流と動きに対応している。
その結果, 子音, 特に発声音と比較して, AMは母音からより予測可能であることが示唆された。
論文 参考訳(メタデータ) (2023-07-26T04:08:12Z) - Sample-Efficient Unsupervised Domain Adaptation of Speech Recognition
Systems A case study for Modern Greek [70.82099772016234]
M2DS2は,大規模な事前学習音声モデルに対して,単純かつサンプル効率のよい微調整手法である。
ソースドメインの自己スーパービジョンを含め、トレーニングを安定させ、潜伏表現のモード崩壊を避けることができる。
論文 参考訳(メタデータ) (2022-12-31T22:57:30Z) - TranSpeech: Speech-to-Speech Translation With Bilateral Perturbation [61.564874831498145]
TranSpeechは、両側摂動を伴う音声から音声への翻訳モデルである。
我々は,非自己回帰S2ST手法を構築し,繰り返しマスキングを行い,単位選択を予測する。
TranSpeechは推論遅延を大幅に改善し、自動回帰技術よりも最大21.4倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2022-05-25T06:34:14Z) - Towards Language Modelling in the Speech Domain Using Sub-word
Linguistic Units [56.52704348773307]
音節や音素を含む言語単位に基づくLSTMに基づく新しい生成音声LMを提案する。
限られたデータセットでは、現代の生成モデルで要求されるものよりも桁違いに小さいので、我々のモデルはバブリング音声を近似する。
補助的なテキストLM,マルチタスク学習目標,補助的な調音特徴を用いた訓練の効果を示す。
論文 参考訳(メタデータ) (2021-10-31T22:48:30Z) - Do Acoustic Word Embeddings Capture Phonological Similarity? An
Empirical Study [12.210797811981173]
本稿では,音響埋め込み空間内の距離が音韻的相似性と相関しているかを問う。
我々は、AWEモデルを2つの言語(ドイツ語とチェコ語)の制御設定で訓練し、単語識別と音韻的類似性という2つのタスクへの埋め込みを評価する。
実験の結果,(1)ベストケースにおける埋め込み空間内の距離は音韻的距離と適度に相関すること,(2)単語識別タスクの性能向上が必ずしも単語の音韻的類似性を反映したモデルを生成するとは限らないことがわかった。
論文 参考訳(メタデータ) (2021-06-16T10:47:56Z) - Differentiable Generative Phonology [47.709731661281]
我々は,音声生成システムをニューラルモデルとして実装する。
従来の音韻学とは異なり、我々のモデルではufは離散文字列ではなく$mathbbrd$の連続ベクトルである。
5言語と28言語をカバーする2つのデータセットにおいて,各モードが有意な音韻弦を推定する能力を評価する。
論文 参考訳(メタデータ) (2021-02-10T19:50:16Z) - Multi-view Temporal Alignment for Non-parallel Articulatory-to-Acoustic
Speech Synthesis [59.623780036359655]
A2A(Articulatory-to-Aoustic)合成は、音声刺激器のキャプチャされた動きから可聴音声の生成を指します。
この手法には、病気や怪我のためにもはや話せない人々への口頭コミュニケーションの回復など、多くの応用がある。
本稿では,多視点学習の理論に基づく問題解決法を提案する。
論文 参考訳(メタデータ) (2020-12-30T15:09:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。