論文の概要: Neural inhibition during speech planning contributes to contrastive
hyperarticulation
- arxiv url: http://arxiv.org/abs/2209.12278v1
- Date: Sun, 25 Sep 2022 17:54:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 15:49:04.151656
- Title: Neural inhibition during speech planning contributes to contrastive
hyperarticulation
- Title(参考訳): 音声計画における神経抑制は、コントラスト高調音に寄与する
- Authors: Michael C. Stern and Jason A. Shaw
- Abstract要約: 本稿では音声開始時間(VOT)計画の動的ニューラルネットワーク(DNF)モデルを提案する。
疑似単語における無声停止子音VOTのCHに関する新しい実験により,モデルの予測を検証した。
その結果, 擬似単語におけるCH効果は, 音声のリアルタイム計画・生成における効果の基盤と一致していることがわかった。
- 参考スコア(独自算出の注目度): 0.17767466724342065
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Previous work has demonstrated that words are hyperarticulated on dimensions
of speech that differentiate them from a minimal pair competitor. This
phenomenon has been termed contrastive hyperarticulation (CH). We present a
dynamic neural field (DNF) model of voice onset time (VOT) planning that
derives CH from an inhibitory influence of the minimal pair competitor during
planning. We test some predictions of the model with a novel experiment
investigating CH of voiceless stop consonant VOT in pseudowords. The results
demonstrate a CH effect in pseudowords, consistent with a basis for the effect
in the real-time planning and production of speech. The scope and magnitude of
CH in pseudowords was reduced compared to CH in real words, consistent with a
role for interactive activation between lexical and phonological levels of
planning. We discuss the potential of our model to unify an apparently
disparate set of phenomena, from CH to phonological neighborhood effects to
phonetic trace effects in speech errors.
- Abstract(参考訳): 従来の研究は、単語が最小対の競合と区別されるような音声の次元に過大評価されていることを示した。
この現象は、コントラッシブ・ハイパーアーティキュレーション(CH)と呼ばれる。
本稿では,音声入力時間(vot)計画の動的ニューラルネットワーク(dnf)モデルを提案する。
疑似単語における無声停止子音VOTのCHに関する新しい実験により,モデルの予測を検証した。
その結果,疑似語ではch効果が示され,実時間計画と音声生成における効果の基礎と一致した。
疑似語におけるchの範囲と大きさは, 実語ではchよりも小さくなり, 語彙レベルと音韻レベル間の対話的アクティベーションの役割と一致した。
我々は,chから音韻的近傍効果から音声誤りにおける音韻的トレース効果まで,明らかに異なる現象の集合を統一するモデルの可能性について議論する。
関連論文リスト
- High-Fidelity Speech Synthesis with Minimal Supervision: All Using
Diffusion Models [56.00939852727501]
最小教師付き音声合成は、2種類の離散音声表現を組み合わせることでTSを分離する。
非自己回帰フレームワークは、制御可能性を高め、持続拡散モデルは、多様化された韻律表現を可能にする。
論文 参考訳(メタデータ) (2023-09-27T09:27:03Z) - CausalDialogue: Modeling Utterance-level Causality in Conversations [83.03604651485327]
クラウドソーシングを通じて、CausalDialogueという新しいデータセットをコンパイルし、拡張しました。
このデータセットは、有向非巡回グラフ(DAG)構造内に複数の因果効果対を含む。
ニューラル会話モデルの訓練における発話レベルにおける因果性の影響を高めるために,Exponential Average Treatment Effect (ExMATE) と呼ばれる因果性強化手法を提案する。
論文 参考訳(メタデータ) (2022-12-20T18:31:50Z) - Self-supervised models of audio effectively explain human cortical
responses to speech [71.57870452667369]
我々は、自己教師型音声表現学習の進歩に乗じて、人間の聴覚システムの最先端モデルを作成する。
これらの結果から,ヒト大脳皮質における音声処理の異なる段階に関連する情報の階層構造を,自己教師型モデルで効果的に把握できることが示唆された。
論文 参考訳(メタデータ) (2022-05-27T22:04:02Z) - Applying Syntax$\unicode{x2013}$Prosody Mapping Hypothesis and Prosodic
Well-Formedness Constraints to Neural Sequence-to-Sequence Speech Synthesis [7.609330016848916]
エンドツーエンドのテキスト音声(TTS)は、テキストや音素の文字列から直接音声を生成する。
本研究は,音韻的制約に基づき,リズミカル言語学を再現できるかどうかを考察する。
学習データに明示的に含まれていない試験データ中の音韻現象を効率よく合成するモデルを提案する。
論文 参考訳(メタデータ) (2022-03-29T06:45:28Z) - Conversational speech recognition leveraging effective fusion methods
for cross-utterance language modeling [12.153618111267514]
音声認識における言語モデリングのための異種会話履歴融合手法を提案する。
現在の発話の音響埋め込みとそれに対応する会話履歴のセマンティックコンテンツとを融合して利用する新しい音声融合機構が導入された。
我々は,ASR N-best仮説再構成タスクを予測問題として,象徴的な事前学習型LMであるBERTを活用する。
論文 参考訳(メタデータ) (2021-11-05T09:07:23Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Towards Modelling Coherence in Spoken Discourse [48.80477600384429]
話し言葉におけるコヒーレンスは、音声の韻律的および音響的パターンに依存している。
音声に基づくコヒーレンスモデルを用いて音声対話におけるコヒーレンスをモデル化する。
論文 参考訳(メタデータ) (2020-12-31T20:18:29Z) - Interpreting glottal flow dynamics for detecting COVID-19 from voice [18.387162887917164]
本稿では声門流波形(GFW)の発声時の微分力学を解析する手法を提案する。
録音音声信号から推定し,音素モデルから計算したGFWと比較する。
提案手法は,2つのGFWの差分において時間空間内の異常を検出するCNNベースの2ステップアテンションモデルを用いている。
論文 参考訳(メタデータ) (2020-10-29T13:16:57Z) - On Long-Tailed Phenomena in Neural Machine Translation [50.65273145888896]
最先端のニューラルネットワーク翻訳(NMT)モデルは、低周波トークンの生成に苦労する。
条件付きテキスト生成における構造的依存関係にモデルトレーニングを適応させるために,新たな損失関数である反焦点損失を提案する。
提案手法は,複数の機械翻訳(MT)データセットに対して有効であり,クロスエントロピーよりも顕著に向上することを示す。
論文 参考訳(メタデータ) (2020-10-10T07:00:57Z) - Prosody Learning Mechanism for Speech Synthesis System Without Text
Length Limit [39.258370942013165]
TTSシステムに基づく音声の韻律をモデル化するための韻律学習機構を提案する。
入力テキスト長の制限を解除するために,ローカルアテンションと呼ばれる新しい自己注意構造を提案する。
英語とマンダリンの実験から, より満足な韻律を持つ音声が得られたことが示唆された。
論文 参考訳(メタデータ) (2020-08-13T02:54:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。