論文の概要: Dramatic Conversation Disentanglement
- arxiv url: http://arxiv.org/abs/2305.16648v1
- Date: Fri, 26 May 2023 05:39:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-29 16:51:44.813048
- Title: Dramatic Conversation Disentanglement
- Title(参考訳): 劇的な会話の絡み合い
- Authors: Kent K. Chang, Danica Chen, David Bamman
- Abstract要約: 本稿では,映画やテレビシリーズにおける会話の絡み合いを研究するための新しいデータセットを提案する。
我々は、社会言語学、社会学、映画研究における理論的研究を用いて、劇的なテキストの会話スレッドを運用する。
予想に反して,過去40年間で平均スレッド長は著しく減少せず,女性であるアクターが演じるキャラクターは,発話時間に比して,より新しい会話スレッドを創出する。
- 参考スコア(独自算出の注目度): 5.32836690371986
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new dataset for studying conversation disentanglement in movies
and TV series. While previous work has focused on conversation disentanglement
in IRC chatroom dialogues, movies and TV shows provide a space for studying
complex pragmatic patterns of floor and topic change in face-to-face
multi-party interactions. In this work, we draw on theoretical research in
sociolinguistics, sociology, and film studies to operationalize a
conversational thread (including the notion of a floor change) in dramatic
texts, and use that definition to annotate a dataset of 10,033 dialogue turns
(comprising 2,209 threads) from 831 movies. We compare the performance of
several disentanglement models on this dramatic dataset, and apply the
best-performing model to disentangle 808 movies. We see that, contrary to
expectation, average thread lengths do not decrease significantly over the past
40 years, and characters portrayed by actors who are women, while
underrepresented, initiate more new conversational threads relative to their
speaking time.
- Abstract(参考訳): 映画やテレビシリーズにおける会話の絡み合いを研究するための新しいデータセットを提案する。
これまでの研究では、ircチャットルームの対話における会話の絡み合いに焦点が当てられていたが、映画やテレビ番組は、対面の多人数対話における床や話題の変化の複雑な実用的パターンを研究するための空間を提供している。
本研究では,社会言語学,社会学,映画研究の理論的研究から,劇的テクストにおける会話スレッド(フロア・チェンジの概念を含む)を運用し,その定義を用いて,831本の映画から10,033の対話ターン(2,209スレッド)のデータセットを注釈付けする。
我々は,この劇的データセット上での複数の不整合モデルの性能を比較し,最も優れた性能モデルを適用して808本の映画を解体する。
期待に反して,過去40年間の平均スレッド長はさほど減少せず,女性俳優によって描かれたキャラクターは,過度に表現されながら,発話時間に対して新たな会話スレッドを開始する。
関連論文リスト
- Mind the Gap Between Conversations for Improved Long-Term Dialogue
Generation [21.109006148673846]
GapChatは、セッション間の時間が異なるマルチセッション対話データセットである。
データセットはリアルタイムに構築されているが、話者の生活における出来事の進行をシミュレートして、長い時間間隔で発生する現実的な対話を生成する。
時間認識モデルは、選択したトピックと会話から得られる情報との関係を判断する指標において、より良いパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-10-24T00:12:38Z) - Conversation Chronicles: Towards Diverse Temporal and Relational
Dynamics in Multi-Session Conversations [9.249662593315541]
我々は,長期会話設定を実装するために,新たに100万件の多セッション対話データセットであるConversation Chroniclesを導入する。
会話年代記の対話エピソードは、一貫性と一貫した相互作用を維持しながら、それらの特性を反映していることを示す。
また、時系列要約と対話生成モジュールで構成されるReBotと呼ばれる対話モデルを提案する。
論文 参考訳(メタデータ) (2023-10-20T11:06:21Z) - SpokenWOZ: A Large-Scale Speech-Text Benchmark for Spoken Task-Oriented
Dialogue Agents [72.42049370297849]
SpokenWOZは音声TODのための大規模音声テキストデータセットである。
SpokenWOZでは、クロスターンスロットと推論スロット検出が新たな課題である。
論文 参考訳(メタデータ) (2023-05-22T13:47:51Z) - Multi-Party Chat: Conversational Agents in Group Settings with Humans
and Models [39.80729604768669]
我々は,多人数会話において,言語モデルが1つ以上のキャラクタとして機能する能力を評価する。
新しいデータセットであるMultiLIGHTは、グループ設定の大幅な改善に役立ちます。
論文 参考訳(メタデータ) (2023-04-26T21:41:17Z) - TikTalk: A Video-Based Dialogue Dataset for Multi-Modal Chitchat in Real
World [97.58623810402563]
我々はTikTalkと呼ばれるビデオベースのマルチモーダル対話データセットを導入する。
人気ビデオ共有プラットフォームから38Kのビデオを収集し、その下のユーザーから367Kの会話を投稿した。
ユーザーはビデオのマルチモーダルな体験に基づいて自発的な会話をし、現実世界のchitchatコンテキストを再現する。
論文 参考訳(メタデータ) (2023-01-14T10:18:22Z) - Channel-aware Decoupling Network for Multi-turn Dialogue Comprehension [81.47133615169203]
本稿では,PrLMの逐次文脈化を超えて,発話間の包括的相互作用のための合成学習を提案する。
私たちは、モデルが対話ドメインに適応するのを助けるために、ドメイン適応型トレーニング戦略を採用しています。
実験の結果,提案手法は4つの公開ベンチマークデータセットにおいて,強力なPrLMベースラインを著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-01-10T13:18:25Z) - TANet: Thread-Aware Pretraining for Abstractive Conversational
Summarization [27.185068253347257]
我々はRedditコミュニティの複数人による議論に基づいて,RCSと呼ばれる大規模(11M)事前学習データセットを構築した。
次に、スレッド対応のTransformerベースのネットワークであるTANetを紹介する。
会話を文の列として扱う既存の事前学習モデルとは異なり、本質的な文脈依存は会話全体を理解する上で重要な役割を担っていると論じる。
論文 参考訳(メタデータ) (2022-04-09T16:08:46Z) - Beyond Goldfish Memory: Long-Term Open-Domain Conversation [43.37382902468993]
複数のチャットセッションからなる人間と人間のデータセットをリリースする。
この長期会話環境では、既存のデータセットでトレーニングされた既存のモデルがどのようにうまく機能するかを示す。
特に,過去の会話を要約し,思い出させる機能を備えた検索拡張手法や手法を見いだす。
論文 参考訳(メタデータ) (2021-07-15T19:01:08Z) - Who Responded to Whom: The Joint Effects of Latent Topics and Discourse
in Conversation Structure [53.77234444565652]
会話談話における応答関係を同定し,会話の開始に応答発話をリンクする。
単語分布における潜在トピックと会話を学習し,ペアワイズ開始応答リンクを予測するモデルを提案する。
英語と中国語の会話における実験結果から,我々のモデルは過去の芸術の状況を大きく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T17:46:00Z) - KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn
Knowledge-driven Conversation [66.99734491847076]
我々は,中国語の多分野知識駆動会話データセットKdConvを提案する。
私たちのコーパスには3つのドメイン(映画、音楽、旅行)から4.5Kの会話と、平均19.0の回転数で86Kの発話が含まれています。
論文 参考訳(メタデータ) (2020-04-08T16:25:39Z) - VIOLIN: A Large-Scale Dataset for Video-and-Language Inference [103.7457132841367]
ビデオとテキストのマルチモーダル理解のための新しいタスク, Video-and-Language Inferenceを導入する。
サブタイトルを前提としたビデオクリップと、そのビデオコンテンツに基づいて自然言語仮説とをペアリングすると、モデルは、その仮説が所定のビデオクリップに関連付けられているか、矛盾しているかを推測する必要がある。
このタスクには、Violin(VIdeO-and-Language Inference)という名の新しい大規模データセットが導入された。
論文 参考訳(メタデータ) (2020-03-25T20:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。