論文の概要: Prosody leaks into the memories of words
- arxiv url: http://arxiv.org/abs/2005.14716v2
- Date: Tue, 29 Dec 2020 16:09:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 23:50:56.677809
- Title: Prosody leaks into the memories of words
- Title(参考訳): 韻律が単語の記憶に漏れる
- Authors: Kevin Tang, Jason A. Shaw
- Abstract要約: 文脈における単語の平均予測可能性(すなわち情報性)は、条件付き単語持続時間を示す。
この研究は過去の研究を2つの方向に拡張し、もう一つの大きな言語である中国語における情報伝達効果について研究した。
その結果,低情報率の単語は短い期間であり,英語で見られる効果を再現していることがわかった。
- 参考スコア(独自算出の注目度): 2.309770674164469
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The average predictability (aka informativity) of a word in context has been
shown to condition word duration (Seyfarth, 2014). All else being equal, words
that tend to occur in more predictable environments are shorter than words that
tend to occur in less predictable environments. One account of the
informativity effect on duration is that the acoustic details of probabilistic
reduction are stored as part of a word's mental representation. Other research
has argued that predictability effects are tied to prosodic structure in
integral ways. With the aim of assessing a potential prosodic basis for
informativity effects in speech production, this study extends past work in two
directions; it investigated informativity effects in another large language,
Mandarin Chinese, and broadened the study beyond word duration to additional
acoustic dimensions, pitch and intensity, known to index prosodic prominence.
The acoustic information of content words was extracted from a large telephone
conversation speech corpus with over 400,000 tokens and 6,000 word types spoken
by 1,655 individuals and analyzed for the effect of informativity using
frequency statistics estimated from a 431 million word subtitle corpus. Results
indicated that words with low informativity have shorter durations, replicating
the effect found in English. In addition, informativity had significant effects
on maximum pitch and intensity, two phonetic dimensions related to prosodic
prominence. Extending this interpretation, these results suggest that
predictability is closely linked to prosodic prominence, and that the lexical
representation of a word includes phonetic details associated with its average
prosodic prominence in discourse. In other words, the lexicon absorbs prosodic
influences on speech production.
- Abstract(参考訳): 文脈における単語の平均予測可能性(いわゆる情報性)は、条件語持続時間(Seyfarth, 2014)を示す。
他の全ての単語は等しく、より予測可能な環境で起こる傾向がある単語は、予測不能な環境で起こる傾向がある単語よりも短い。
持続時間に対する情報伝達効果の1つの説明は、確率的還元の音響的詳細が単語の心的表現の一部として記憶されていることである。
他の研究は、予測可能性効果は積分的に韻律構造に結びついていると主張している。
本研究は、音声生成における情報伝達効果の潜在的な韻律的基礎を評価することを目的として、過去の研究を2つの方向に拡張し、他の大きな言語である中国語のマンダリンにおける情報伝達効果を調査し、単語持続時間を超えて、さらに音響的次元、ピッチ、強度を指標韻律的優位性に拡張した。
内容語の音響情報は,4億3300万字字幕コーパスから推定される周波数統計を用いて,1,655人の個人によって話される40,000以上のトークンと6,000の単語タイプを持つ大通話音声コーパスから抽出された。
その結果,低情報化語は短命であり,英語で見られる効果を再現していることがわかった。
さらに,情報伝達力は最大ピッチと強度,韻律的優位性に関連する2つの音韻次元に有意な影響を及ぼした。
この解釈を拡張して、これらの結果は予測可能性が韻律的プロミネンスと密接に関連していることを示し、単語の語彙的表現には、談話における平均韻律的プロミネンスに関連する音韻的詳細が含まれていることを示唆している。
言い換えれば、語彙は音声生成に対する韻律的影響を吸収する。
関連論文リスト
- Surprise! Uniform Information Density Isn't the Whole Story: Predicting Surprisal Contours in Long-form Discourse [54.08750245737734]
話者は、階層的に構造化された談話モデル内の位置に基づいて、情報率を変調する。
階層的予測器は談話の情報輪郭の重要な予測器であり,深い階層的予測器は浅い予測器よりも予測力が高いことがわかった。
論文 参考訳(メタデータ) (2024-10-21T14:42:37Z) - Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - Improving Mandarin Prosodic Structure Prediction with Multi-level
Contextual Information [68.89000132126536]
本研究は,音声間言語情報を用いて韻律構造予測(PSP)の性能を向上させることを提案する。
提案手法は,韻律語(PW),韻律語(PPH),国際語句(IPH)の予測におけるF1スコアの向上を実現する。
論文 参考訳(メタデータ) (2023-08-31T09:19:15Z) - Investigating the Utility of Surprisal from Large Language Models for
Speech Synthesis Prosody [4.081433571732691]
本稿では,音声の韻律合成を支援する機能として,ある文脈における単語の予測可能性の尺度である単語代名詞の使用について検討する。
様々な大きさの英語テキストと大言語モデル(LLM)を用いて実験を行う。
語源と語長は適度に相関し,関連性はあるものの言語使用の異なる側面を捉えていることが示唆された。
論文 参考訳(メタデータ) (2023-06-16T12:49:44Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - Discourse Context Predictability Effects in Hindi Word Order [14.88833412862455]
文中の単語と構文構造が次の文の語順にどのように影響するかを検討する。
我々は,言論に基づく多くの特徴と認知的特徴を用いて,依存関係の長さ,前提,情報状態などの予測を行う。
情報ステータスとLSTMに基づく談話予測が単語の順序選択に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2022-10-25T11:53:01Z) - Unsupervised Multimodal Word Discovery based on Double Articulation
Analysis with Co-occurrence cues [7.332652485849632]
ヒトの幼児は、言語に関する最小限の事前知識で口頭語彙を取得する。
本研究では,音声単位を発見するための教師なし学習手法を提案する。
提案手法は教師なし学習を用いて音声信号から単語と音素を取得することができる。
論文 参考訳(メタデータ) (2022-01-18T07:31:59Z) - Disambiguatory Signals are Stronger in Word-initial Positions [48.18148856974974]
単語の初期と後期のセグメントの情報を比較するための既存の手法の相違点を指摘する。
何百もの言語にまたがって、言葉で情報を読み込むという言語横断的な傾向があるという証拠が見つかりました。
論文 参考訳(メタデータ) (2021-02-03T18:19:16Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。