論文の概要: Statistical laws and linguistics inform meaning in naturalistic and fictional conversation
- arxiv url: http://arxiv.org/abs/2512.18072v1
- Date: Fri, 19 Dec 2025 21:21:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.177136
- Title: Statistical laws and linguistics inform meaning in naturalistic and fictional conversation
- Title(参考訳): 自然主義的・架空の会話における統計的法則と言語学の意義
- Authors: Ashley M. A. Fehr, Calla G. Beauregard, Julia Witte Zimmerman, Katie Ekström, Pablo Rosillo-Rodes, Christopher M. Danforth, Peter Sheridan Dodds,
- Abstract要約: ヒープスの法則では、語彙のサイズは文書の長さでスケールする。
2つの異なる媒体で記録された会話に対するヒープの法則を測定する。
語彙の大きさのスケーリングは、音声の一部によって異なることがわかった。
- 参考スコア(独自算出の注目度): 0.47744506020270405
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conversation is a cornerstone of social connection and is linked to well-being outcomes. Conversations vary widely in type with some portion generating complex, dynamic stories. One approach to studying how conversations unfold in time is through statistical patterns such as Heaps' law, which holds that vocabulary size scales with document length. Little work on Heaps's law has looked at conversation and considered how language features impact scaling. We measure Heaps' law for conversations recorded in two distinct mediums: 1. Strangers brought together on video chat and 2. Fictional characters in movies. We find that scaling of vocabulary size differs by parts of speech. We discuss these findings through behavioral and linguistic frameworks.
- Abstract(参考訳): 会話は社会的つながりの基盤であり、幸福な結果に結びついている。
会話はタイプによって大きく異なり、一部は複雑で動的なストーリーを生成する。
会話が時間内にどのように展開されるかを研究する1つのアプローチは、ヒープの法則のような統計的なパターンを通じてである。
Heapsの法則に関する研究はほとんどなく、会話や言語機能がスケーリングに与える影響について考察している。
我々は2つの異なる媒体で記録された会話に対するヒープの法則を測定する。
1.ストランガーがビデオチャットで集まってきたこと
2.映画における架空の人物。
語彙の大きさのスケーリングは、音声の一部によって異なることがわかった。
本稿では,これらの知見を行動学および言語学の枠組みを通して論じる。
関連論文リスト
- Aligning Spoken Dialogue Models from User Interactions [55.192134724622235]
本稿では,ユーザの対話からリアルタイム会話における音声対話モデルを改善するための新しい嗜好アライメントフレームワークを提案する。
AIフィードバックを付加した生のマルチターン音声会話から15万以上の好みペアのデータセットを作成する。
本研究は, 自然なリアルタイム音声対話システムにおいて重要な, 様々な力学におけるバランスの整合性の重要性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-06-26T16:45:20Z) - The time scale of redundancy between prosody and linguistic context [22.04241078302997]
単語の韻律的特徴は、拡張された過去の文脈を確実に予測する必要がある。
また、単語の韻律的特徴は、将来の単語と多少の冗長性を示すが、1-2ワードの短いスケールしか持たない。
論文 参考訳(メタデータ) (2025-03-14T17:48:23Z) - Entropy and type-token ratio in gigaword corpora [0.0]
語彙の多様性はタイプトケン比とエントロピーで特徴づけられる。
英語,スペイン語,トルコ語の6つの大規模言語データセットにおける多様性指標について検討した。
与えられたコーパスと言語のテキストのエントロピーとタイプトケン比の実証的機能関係を明らかにした。
論文 参考訳(メタデータ) (2024-11-15T14:40:59Z) - Personality Differences Drive Conversational Dynamics: A High-Dimensional NLP Approach [1.9336815376402723]
我々は、見知らぬ人との対話の軌跡を高次元空間にマッピングする。
本研究は,オープンネスの個性次元の差が大きいインターロケータが相互に影響し,幅広い話題を議論するのにより多くの時間を費やすことを示唆している。
また、参加者の感情(感情)が会話の前から後までどのように変化するかを調べ、外転の差が大きいと影響の差が大きくなることを予測している。
論文 参考訳(メタデータ) (2024-10-14T19:48:31Z) - Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - Toward Joint Language Modeling for Speech Units and Text [89.32163954508489]
音声単位とテキストの共用言語モデリングについて検討する。
音声とテキストの混在度を評価するための自動計測手法を提案する。
提案手法を用いて音声単位とテキストを混合することにより,SLUタスクにおける音声のみのベースラインを改良することを示す。
論文 参考訳(メタデータ) (2023-10-12T20:53:39Z) - SpokenWOZ: A Large-Scale Speech-Text Benchmark for Spoken Task-Oriented Dialogue Agents [70.08842857515141]
SpokenWOZは音声TODのための大規模音声テキストデータセットである。
SpokenWOZでは、クロスターンスロットと推論スロット検出が新たな課題である。
論文 参考訳(メタデータ) (2023-05-22T13:47:51Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - Advancing an Interdisciplinary Science of Conversation: Insights from a
Large Multimodal Corpus of Human Speech [0.12038936091716987]
本報告では, 対話の学際的科学を推進し, 音声英語で記録された1,656件の多モーダルコーパスから得られた知見を報告する。
この700万語以上の単語と850時間のコーパスは、1TB以上の音声、ビデオ、そして文字起こしで、声、顔、意味表現のモーメント・ツー・モーメント(モーメント)を計測する。
本報告では, 多様な背景を持つ個人がコミュニケーションパターンをどう変化させ, 接続する方法を見出すかを示す, 定量的分析と定性的な各録音の質的レビューに基づいて, 総合的な混合手法のレポートを報告する。
論文 参考訳(メタデータ) (2022-03-01T18:50:33Z) - Aspectuality Across Genre: A Distributional Semantics Approach [25.816944882581343]
英語における動詞の語彙的側面の解釈は、文的含意を認識し、談話レベルの推論を学ぶ上で重要な役割を担っている。
アスペクト型クラス,状態対イベント,およびテクスチャ対テイリック事象の2つの基本次元を分散意味論で効果的にモデル化できることが示される。
論文 参考訳(メタデータ) (2020-10-31T19:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。