論文の概要: Neural inhibition during speech planning contributes to contrastive
hyperarticulation
- arxiv url: http://arxiv.org/abs/2209.12278v1
- Date: Sun, 25 Sep 2022 17:54:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 15:49:04.151656
- Title: Neural inhibition during speech planning contributes to contrastive
hyperarticulation
- Title(参考訳): 音声計画における神経抑制は、コントラスト高調音に寄与する
- Authors: Michael C. Stern and Jason A. Shaw
- Abstract要約: 本稿では音声開始時間(VOT)計画の動的ニューラルネットワーク(DNF)モデルを提案する。
疑似単語における無声停止子音VOTのCHに関する新しい実験により,モデルの予測を検証した。
その結果, 擬似単語におけるCH効果は, 音声のリアルタイム計画・生成における効果の基盤と一致していることがわかった。
- 参考スコア(独自算出の注目度): 0.17767466724342065
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Previous work has demonstrated that words are hyperarticulated on dimensions
of speech that differentiate them from a minimal pair competitor. This
phenomenon has been termed contrastive hyperarticulation (CH). We present a
dynamic neural field (DNF) model of voice onset time (VOT) planning that
derives CH from an inhibitory influence of the minimal pair competitor during
planning. We test some predictions of the model with a novel experiment
investigating CH of voiceless stop consonant VOT in pseudowords. The results
demonstrate a CH effect in pseudowords, consistent with a basis for the effect
in the real-time planning and production of speech. The scope and magnitude of
CH in pseudowords was reduced compared to CH in real words, consistent with a
role for interactive activation between lexical and phonological levels of
planning. We discuss the potential of our model to unify an apparently
disparate set of phenomena, from CH to phonological neighborhood effects to
phonetic trace effects in speech errors.
- Abstract(参考訳): 従来の研究は、単語が最小対の競合と区別されるような音声の次元に過大評価されていることを示した。
この現象は、コントラッシブ・ハイパーアーティキュレーション(CH)と呼ばれる。
本稿では,音声入力時間(vot)計画の動的ニューラルネットワーク(dnf)モデルを提案する。
疑似単語における無声停止子音VOTのCHに関する新しい実験により,モデルの予測を検証した。
その結果,疑似語ではch効果が示され,実時間計画と音声生成における効果の基礎と一致した。
疑似語におけるchの範囲と大きさは, 実語ではchよりも小さくなり, 語彙レベルと音韻レベル間の対話的アクティベーションの役割と一致した。
我々は,chから音韻的近傍効果から音声誤りにおける音韻的トレース効果まで,明らかに異なる現象の集合を統一するモデルの可能性について議論する。
関連論文リスト
- Spontaneous Style Text-to-Speech Synthesis with Controllable Spontaneous Behaviors Based on Language Models [55.898594710420326]
本稿では,言語モデルに基づく新たな自然音声合成システムを提案する。
自発音声における微妙な韻律変化を捉えるモデルの能力を高めるために, きめ細かい韻律モデリングを導入する。
論文 参考訳(メタデータ) (2024-07-18T13:42:38Z) - Investigating the Timescales of Language Processing with EEG and Language Models [0.0]
本研究では,事前学習した言語モデルと脳波データからの単語表現のアライメントを検討することで,言語処理の時間的ダイナミクスについて検討する。
テンポラル・レスポンス・ファンクション(TRF)モデルを用いて、神経活動が異なる層にまたがるモデル表現とどのように対応するかを検討する。
分析の結果,異なる層からのTRFのパターンが明らかとなり,語彙的および構成的処理への様々な貢献が明らかになった。
論文 参考訳(メタデータ) (2024-06-28T12:49:27Z) - Perception of Phonological Assimilation by Neural Speech Recognition Models [3.4173734484549625]
本稿では、ニューラルネットワーク認識モデルであるWav2Vec2が、同化音をどのように知覚するかを考察する。
心理言語学的刺激を用いて、様々な言語文脈がモデル出力の補償パターンにどのように影響するかを分析する。
論文 参考訳(メタデータ) (2024-06-21T15:58:22Z) - Leveraging the Interplay Between Syntactic and Acoustic Cues for Optimizing Korean TTS Pause Formation [6.225927189801006]
本稿では,パジングパターンに関連する構文的手法と音響的手法の両方を包括的にモデル化する新しい枠組みを提案する。
注目に値することに、我々のフレームワークは、より拡張され複雑なドメイン外文(OOD)であっても、自然言語を一貫して生成する能力を持っている。
論文 参考訳(メタデータ) (2024-04-03T09:17:38Z) - High-Fidelity Speech Synthesis with Minimal Supervision: All Using
Diffusion Models [56.00939852727501]
最小教師付き音声合成は、2種類の離散音声表現を組み合わせることでTSを分離する。
非自己回帰フレームワークは、制御可能性を高め、持続拡散モデルは、多様化された韻律表現を可能にする。
論文 参考訳(メタデータ) (2023-09-27T09:27:03Z) - CausalDialogue: Modeling Utterance-level Causality in Conversations [83.03604651485327]
クラウドソーシングを通じて、CausalDialogueという新しいデータセットをコンパイルし、拡張しました。
このデータセットは、有向非巡回グラフ(DAG)構造内に複数の因果効果対を含む。
ニューラル会話モデルの訓練における発話レベルにおける因果性の影響を高めるために,Exponential Average Treatment Effect (ExMATE) と呼ばれる因果性強化手法を提案する。
論文 参考訳(メタデータ) (2022-12-20T18:31:50Z) - Applying Syntax$\unicode{x2013}$Prosody Mapping Hypothesis and Prosodic
Well-Formedness Constraints to Neural Sequence-to-Sequence Speech Synthesis [7.609330016848916]
エンドツーエンドのテキスト音声(TTS)は、テキストや音素の文字列から直接音声を生成する。
本研究は,音韻的制約に基づき,リズミカル言語学を再現できるかどうかを考察する。
学習データに明示的に含まれていない試験データ中の音韻現象を効率よく合成するモデルを提案する。
論文 参考訳(メタデータ) (2022-03-29T06:45:28Z) - Conversational speech recognition leveraging effective fusion methods
for cross-utterance language modeling [12.153618111267514]
音声認識における言語モデリングのための異種会話履歴融合手法を提案する。
現在の発話の音響埋め込みとそれに対応する会話履歴のセマンティックコンテンツとを融合して利用する新しい音声融合機構が導入された。
我々は,ASR N-best仮説再構成タスクを予測問題として,象徴的な事前学習型LMであるBERTを活用する。
論文 参考訳(メタデータ) (2021-11-05T09:07:23Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Towards Modelling Coherence in Spoken Discourse [48.80477600384429]
話し言葉におけるコヒーレンスは、音声の韻律的および音響的パターンに依存している。
音声に基づくコヒーレンスモデルを用いて音声対話におけるコヒーレンスをモデル化する。
論文 参考訳(メタデータ) (2020-12-31T20:18:29Z) - On Long-Tailed Phenomena in Neural Machine Translation [50.65273145888896]
最先端のニューラルネットワーク翻訳(NMT)モデルは、低周波トークンの生成に苦労する。
条件付きテキスト生成における構造的依存関係にモデルトレーニングを適応させるために,新たな損失関数である反焦点損失を提案する。
提案手法は,複数の機械翻訳(MT)データセットに対して有効であり,クロスエントロピーよりも顕著に向上することを示す。
論文 参考訳(メタデータ) (2020-10-10T07:00:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。