論文の概要: Quantifying the redundancy between prosody and text
- arxiv url: http://arxiv.org/abs/2311.17233v1
- Date: Tue, 28 Nov 2023 21:15:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-30 23:14:12.696023
- Title: Quantifying the redundancy between prosody and text
- Title(参考訳): 韻律とテキストの冗長性の定量化
- Authors: Lukas Wolf, Tiago Pimentel, Evelina Fedorenko, Ryan Cotterell, Alex
Warstadt, Ethan Wilcox, Tamar Regev
- Abstract要約: 我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
- 参考スコア(独自算出の注目度): 67.07817268372743
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prosody -- the suprasegmental component of speech, including pitch, loudness,
and tempo -- carries critical aspects of meaning. However, the relationship
between the information conveyed by prosody vs. by the words themselves remains
poorly understood. We use large language models (LLMs) to estimate how much
information is redundant between prosody and the words themselves. Using a
large spoken corpus of English audiobooks, we extract prosodic features aligned
to individual words and test how well they can be predicted from LLM
embeddings, compared to non-contextual word embeddings. We find a high degree
of redundancy between the information carried by the words and prosodic
information across several prosodic features, including intensity, duration,
pauses, and pitch contours. Furthermore, a word's prosodic information is
redundant with both the word itself and the context preceding as well as
following it. Still, we observe that prosodic features can not be fully
predicted from text, suggesting that prosody carries information above and
beyond the words. Along with this paper, we release a general-purpose data
processing pipeline for quantifying the relationship between linguistic
information and extra-linguistic features.
- Abstract(参考訳): 韻律(Prosody)は、ピッチ、ラウドネス、テンポを含む音声の超音節的要素であり、意味の重要な側面を持っている。
しかし、韻律によって伝達される情報と語自体の関係は、まだよく分かっていない。
我々は大言語モデル(LLM)を用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
英語オーディオブックの大規模なコーパスを用いて、個々の単語に整列した韻律的特徴を抽出し、LLM埋め込みによる予測の精度を、非文脈単語埋め込みと比較して検証する。
単語が持つ情報と韻律情報との間には,強度,持続時間,停止時間,ピッチ輪郭など,様々な韻律的特徴がある。
さらに、単語の韻律情報は、単語自体とそれに続く文脈の両方で冗長である。
それでも、韻律的特徴がテキストから完全には予測できないことを観察し、韻律が単語の上や上からの情報を運ぶことを示唆する。
本稿では,言語情報と言語外特徴との関係を定量化するための汎用データ処理パイプラインをリリースする。
関連論文リスト
- Improving Mandarin Prosodic Structure Prediction with Multi-level
Contextual Information [68.89000132126536]
本研究は,音声間言語情報を用いて韻律構造予測(PSP)の性能を向上させることを提案する。
提案手法は,韻律語(PW),韻律語(PPH),国際語句(IPH)の予測におけるF1スコアの向上を実現する。
論文 参考訳(メタデータ) (2023-08-31T09:19:15Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - Evaluation of Automatically Constructed Word Meaning Explanations [0.0]
非常に大規模なコーパスからの集合情報に基づいて,説明を自動的に導き出す新しいツールを提案する。
提案手法は,約90%のケースにおいて,単語の意味を理解するのに有用なデータを含む説明を作成できることを示す。
論文 参考訳(メタデータ) (2023-02-27T09:47:55Z) - Representing `how you say' with `what you say': English corpus of
focused speech and text reflecting corresponding implications [10.103202030679844]
音声通信では、何かが語られる方法(パラ言語情報)は、何を言うか(言語情報)と同じくらい重要である
現在の音声翻訳システムは、発話が言語的に同一であれば、同じ翻訳を返す。
本稿では,語彙・文法機器を用いて,言語領域にパラ言語情報をマッピングする手法を提案する。
論文 参考訳(メタデータ) (2022-03-29T12:29:22Z) - Pareto Probing: Trading Off Accuracy for Complexity [87.09294772742737]
我々は,プローブの複雑性と性能の基本的なトレードオフを反映したプローブ計量について論じる。
係り受け解析による実験により,文脈表現と非文脈表現の統語的知識の幅広いギャップが明らかとなった。
論文 参考訳(メタデータ) (2020-10-05T17:27:31Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Paragraph-level Commonsense Transformers with Recurrent Memory [77.4133779538797]
物語からコヒーレントなコモンセンス推論を生成するために,段落レベルの情報を含む談話認識モデルを訓練する。
以上の結果から,PARA-COMETは文レベルのベースライン,特にコヒーレントかつ新規な推論に優れていた。
論文 参考訳(メタデータ) (2020-10-04T05:24:12Z) - Prosody leaks into the memories of words [2.309770674164469]
文脈における単語の平均予測可能性(すなわち情報性)は、条件付き単語持続時間を示す。
この研究は過去の研究を2つの方向に拡張し、もう一つの大きな言語である中国語における情報伝達効果について研究した。
その結果,低情報率の単語は短い期間であり,英語で見られる効果を再現していることがわかった。
論文 参考訳(メタデータ) (2020-05-29T17:58:33Z) - Heaps' law and Heaps functions in tagged texts: Evidences of their
linguistic relevance [0.0]
英文学作品75ドルのコーパスにおいて,語彙サイズと文長の関係について検討した。
我々は、各テキストに沿って、各タグの新しい単語の進行的な出現を分析する。
論文 参考訳(メタデータ) (2020-01-07T17:05:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。