論文の概要: Advancing an Interdisciplinary Science of Conversation: Insights from a
Large Multimodal Corpus of Human Speech
- arxiv url: http://arxiv.org/abs/2203.00674v1
- Date: Tue, 1 Mar 2022 18:50:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-02 14:55:07.762722
- Title: Advancing an Interdisciplinary Science of Conversation: Insights from a
Large Multimodal Corpus of Human Speech
- Title(参考訳): 会話の学際的科学の進歩--人間の発話の大規模マルチモーダルコーパスからの洞察
- Authors: Andrew Reece, Gus Cooney, Peter Bull, Christine Chung, Bryn Dawson,
Casey Fitzpatrick, Tamara Glazer, Dean Knox, Alex Liebscher and Sebastian
Marin
- Abstract要約: 本報告では, 対話の学際的科学を推進し, 音声英語で記録された1,656件の多モーダルコーパスから得られた知見を報告する。
この700万語以上の単語と850時間のコーパスは、1TB以上の音声、ビデオ、そして文字起こしで、声、顔、意味表現のモーメント・ツー・モーメント(モーメント)を計測する。
本報告では, 多様な背景を持つ個人がコミュニケーションパターンをどう変化させ, 接続する方法を見出すかを示す, 定量的分析と定性的な各録音の質的レビューに基づいて, 総合的な混合手法のレポートを報告する。
- 参考スコア(独自算出の注目度): 0.12038936091716987
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: People spend a substantial portion of their lives engaged in conversation,
and yet our scientific understanding of conversation is still in its infancy.
In this report we advance an interdisciplinary science of conversation, with
findings from a large, novel, multimodal corpus of 1,656 recorded conversations
in spoken English. This 7+ million word, 850 hour corpus totals over 1TB of
audio, video, and transcripts, with moment-to-moment measures of vocal, facial,
and semantic expression, along with an extensive survey of speaker post
conversation reflections. We leverage the considerable scope of the corpus to
(1) extend key findings from the literature, such as the cooperativeness of
human turn-taking; (2) define novel algorithmic procedures for the segmentation
of speech into conversational turns; (3) apply machine learning insights across
various textual, auditory, and visual features to analyze what makes
conversations succeed or fail; and (4) explore how conversations are related to
well-being across the lifespan. We also report (5) a comprehensive mixed-method
report, based on quantitative analysis and qualitative review of each
recording, that showcases how individuals from diverse backgrounds alter their
communication patterns and find ways to connect. We conclude with a discussion
of how this large-scale public dataset may offer new directions for future
research, especially across disciplinary boundaries, as scholars from a variety
of fields appear increasingly interested in the study of conversation.
- Abstract(参考訳): 人々は人生の大部分を会話に費やしていますが、私たちの会話に関する科学的理解はまだ初期段階です。
本報告では,対話の学際的科学を推進し,音声による会話を1,656件記録した,大規模で斬新な多モーダルコーパスから発見する。
この700万語以上の単語と850時間のコーパスは、1TB以上の音声、ビデオ、文字起こし、音声、顔、セマンティック表現のモーメント・ツー・モーメント、および話者の会話のリフレクションの広範な調査を含む。
コーパスのかなりの範囲を活用して,(1)人間のターンテイクの協調性,(2)音声を会話のターンに分割するための新しいアルゴリズムの手順,(3)会話が成功するか失敗するかを分析するためのさまざまなテキスト,聴覚,視覚的特徴に機械学習の洞察を適用し,(4)会話がライフスパン全体の幸福とどのように関係しているかを探求する。
また, 様々な背景の個人がコミュニケーションパターンをどう変化させ, 接続する方法を見出すかを示す, 定量的分析と定性的な各録音の質的レビューに基づく総合的混合手法レポートを報告した。
さまざまな分野の学者が会話研究に関心を抱いているようにみえるため、この大規模な公開データセットが今後の研究、特に学際的な境界を越えてどのように新たな方向性を提供するかについて議論した。
関連論文リスト
- WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - Conversation Chronicles: Towards Diverse Temporal and Relational
Dynamics in Multi-Session Conversations [9.249662593315541]
我々は,長期会話設定を実装するために,新たに100万件の多セッション対話データセットであるConversation Chroniclesを導入する。
会話年代記の対話エピソードは、一貫性と一貫した相互作用を維持しながら、それらの特性を反映していることを示す。
また、時系列要約と対話生成モジュールで構成されるReBotと呼ばれる対話モデルを提案する。
論文 参考訳(メタデータ) (2023-10-20T11:06:21Z) - Multi-turn Dialogue Comprehension from a Topic-aware Perspective [70.37126956655985]
本稿では,話題認識の観点から,マルチターン対話をモデル化することを提案する。
対話文のセグメント化アルゴリズムを用いて、対話文を教師なしの方法でトピック集中フラグメントに分割する。
また,トピックセグメントを処理要素として扱う新しいモデルとして,トピック認識デュアルアテンションマッチング(TADAM)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T11:03:55Z) - NewsDialogues: Towards Proactive News Grounded Conversation [72.10055780635625]
本稿では,対話システムがニュースの重要な話題に基づいて会話を積極的にリードする新しいタスク,Proactive News Grounded Conversationを提案する。
この課題をさらに発展させるために、人間と人間の対話データセットtsNewsDialoguesを収集し、合計14.6Kの発話を含む1Kの会話を含む。
論文 参考訳(メタデータ) (2023-08-12T08:33:42Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - Who says like a style of Vitamin: Towards Syntax-Aware
DialogueSummarization using Multi-task Learning [2.251583286448503]
個々の話者からの発声と独特の統語構造との関係に焦点をあてる。
話者は、音声プリントのような言語情報を含むことができる独自のテキストスタイルを持つ。
構文認識情報と対話要約の両方をマルチタスクで学習する。
論文 参考訳(メタデータ) (2021-09-29T05:30:39Z) - Advances in Multi-turn Dialogue Comprehension: A Survey [51.215629336320305]
対話モデリングの観点から,従来の手法を検討した。
対話理解タスクで広く使用されている対話モデリングの3つの典型的なパターンについて議論します。
論文 参考訳(メタデータ) (2021-03-04T15:50:17Z) - MultiTalk: A Highly-Branching Dialog Testbed for Diverse Conversations [39.81965687032923]
会話対話文のコーパスであるMultiTalkデータセットについて述べる。
高分岐環境におけるダイアログ生成の研究に複数の貢献をしている。
我々の達成課題は心の問題の挑戦的理論であり、制御可能な生成課題である。
論文 参考訳(メタデータ) (2021-02-02T02:29:40Z) - KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn
Knowledge-driven Conversation [66.99734491847076]
我々は,中国語の多分野知識駆動会話データセットKdConvを提案する。
私たちのコーパスには3つのドメイン(映画、音楽、旅行)から4.5Kの会話と、平均19.0の回転数で86Kの発話が含まれています。
論文 参考訳(メタデータ) (2020-04-08T16:25:39Z) - Detecting depression in dyadic conversations with multimodal narratives
and visualizations [1.4824891788575418]
本稿では,人間による会話の分析を支援するシステムを開発する。
本研究では,マルチモーダル情報を広範囲に取り込み,個人の抑うつ状態を予測するための予測スコアを自動生成するシステムについて述べる。
論文 参考訳(メタデータ) (2020-01-13T10:47:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。