論文の概要: KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn
Knowledge-driven Conversation
- arxiv url: http://arxiv.org/abs/2004.04100v1
- Date: Wed, 8 Apr 2020 16:25:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 07:59:27.953704
- Title: KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn
Knowledge-driven Conversation
- Title(参考訳): KdConv: マルチターン知識駆動会話に向けた中国語多ドメイン対話データセット
- Authors: Hao Zhou, Chujie Zheng, Kaili Huang, Minlie Huang, Xiaoyan Zhu
- Abstract要約: 我々は,中国語の多分野知識駆動会話データセットKdConvを提案する。
私たちのコーパスには3つのドメイン(映画、音楽、旅行)から4.5Kの会話と、平均19.0の回転数で86Kの発話が含まれています。
- 参考スコア(独自算出の注目度): 66.99734491847076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The research of knowledge-driven conversational systems is largely limited
due to the lack of dialog data which consist of multi-turn conversations on
multiple topics and with knowledge annotations. In this paper, we propose a
Chinese multi-domain knowledge-driven conversation dataset, KdConv, which
grounds the topics in multi-turn conversations to knowledge graphs. Our corpus
contains 4.5K conversations from three domains (film, music, and travel), and
86K utterances with an average turn number of 19.0. These conversations contain
in-depth discussions on related topics and natural transition between multiple
topics. To facilitate the following research on this corpus, we provide several
benchmark models. Comparative results show that the models can be enhanced by
introducing background knowledge, yet there is still a large space for
leveraging knowledge to model multi-turn conversations for further research.
Results also show that there are obvious performance differences between
different domains, indicating that it is worth to further explore transfer
learning and domain adaptation. The corpus and benchmark models are publicly
available.
- Abstract(参考訳): 知識駆動会話システムの研究は、複数のトピックに関するマルチターン会話と知識アノテーションからなる対話データがないため、ほとんど制限されている。
本稿では,マルチターン会話の話題をナレッジグラフに反映する,中国語の多領域知識駆動対話データセットであるkdconvを提案する。
コーパスには3つのドメイン(映画、音楽、旅行)から4.5kの会話と、平均ターン数19.0の86kの発話が含まれている。
これらの会話には、関連するトピックと複数のトピック間の自然な移行に関する詳細な議論が含まれている。
このコーパスに関する以下の研究を容易にするため、いくつかのベンチマークモデルを提供する。
比較の結果,背景知識の導入によりモデルの拡張が可能となったが,複数ターン会話のモデル化に知識を活用するための大きな空間が依然として残っている。
結果は、異なるドメイン間に明らかなパフォーマンスの違いがあることを示し、転送学習とドメイン適応をさらに検討する価値があることを示している。
コーパスとベンチマークモデルは公開されている。
関連論文リスト
- WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - Multi-Granularity Prompts for Topic Shift Detection in Dialogue [13.739991183173494]
対話トピックシフト検出の目標は、会話中の現在のトピックが変更されたか、変更する必要があるかを特定することである。
従来の研究は、事前訓練されたモデルを用いて発話を符号化するトピックシフトの検出に重点を置いていた。
我々は,複数粒度での対話,すなわちラベル,ターン,トピックから話題情報を抽出するために,プロンプトベースのアプローチを採用する。
論文 参考訳(メタデータ) (2023-05-23T12:35:49Z) - TikTalk: A Video-Based Dialogue Dataset for Multi-Modal Chitchat in Real
World [97.58623810402563]
我々はTikTalkと呼ばれるビデオベースのマルチモーダル対話データセットを導入する。
人気ビデオ共有プラットフォームから38Kのビデオを収集し、その下のユーザーから367Kの会話を投稿した。
ユーザーはビデオのマルチモーダルな体験に基づいて自発的な会話をし、現実世界のchitchatコンテキストを再現する。
論文 参考訳(メタデータ) (2023-01-14T10:18:22Z) - CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog
Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。
96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。
学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文 参考訳(メタデータ) (2022-11-21T16:21:41Z) - Exploring Effective Information Utilization in Multi-Turn Topic-Driven
Conversations [11.550422073645425]
We encodeed topic and dialogue history information using certain prompts with multiple channel of Fusion-in-Decoder (FiD)
本稿では,最近のニュースを中心に会話が展開されるNaturalConvという,中国の特定のデータセットに焦点を当てた実験を行った。
論文 参考訳(メタデータ) (2022-09-01T06:20:39Z) - Advancing an Interdisciplinary Science of Conversation: Insights from a
Large Multimodal Corpus of Human Speech [0.12038936091716987]
本報告では, 対話の学際的科学を推進し, 音声英語で記録された1,656件の多モーダルコーパスから得られた知見を報告する。
この700万語以上の単語と850時間のコーパスは、1TB以上の音声、ビデオ、そして文字起こしで、声、顔、意味表現のモーメント・ツー・モーメント(モーメント)を計測する。
本報告では, 多様な背景を持つ個人がコミュニケーションパターンをどう変化させ, 接続する方法を見出すかを示す, 定量的分析と定性的な各録音の質的レビューに基づいて, 総合的な混合手法のレポートを報告する。
論文 参考訳(メタデータ) (2022-03-01T18:50:33Z) - QAConv: Question Answering on Informative Conversations [85.2923607672282]
ビジネスメールやパネルディスカッション,作業チャネルなど,情報的な会話に重点を置いています。
合計で、スパンベース、フリーフォーム、および回答不能な質問を含む34,204のQAペアを収集します。
論文 参考訳(メタデータ) (2021-05-14T15:53:05Z) - NaturalConv: A Chinese Dialogue Dataset Towards Multi-turn Topic-driven Conversation [28.085557013067678]
本稿では,中国におけるマルチターン話題駆動型会話データセットであるNaturalConvを提案する。
私たちのコーパスには、6つのドメインからの19.9Kの会話と、平均20.1のターン数で400Kの発話が含まれています。
論文 参考訳(メタデータ) (2021-03-03T17:38:33Z) - MultiTalk: A Highly-Branching Dialog Testbed for Diverse Conversations [39.81965687032923]
会話対話文のコーパスであるMultiTalkデータセットについて述べる。
高分岐環境におけるダイアログ生成の研究に複数の貢献をしている。
我々の達成課題は心の問題の挑戦的理論であり、制御可能な生成課題である。
論文 参考訳(メタデータ) (2021-02-02T02:29:40Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。