論文の概要: CrossDial: An Entertaining Dialogue Dataset of Chinese Crosstalk
- arxiv url: http://arxiv.org/abs/2209.01370v1
- Date: Sat, 3 Sep 2022 08:42:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 13:33:47.632766
- Title: CrossDial: An Entertaining Dialogue Dataset of Chinese Crosstalk
- Title(参考訳): CrossDial:中国のクロストークの対話データセット
- Authors: Baizhou Huang, Shikang Du, Xiaojun Wan
- Abstract要約: クロストーク(Crosstalk)は中国の伝統芸能である。
我々はCrossDialを紹介した。CrossDialは、Webからクロールされた中国の古典的クロストークを含む、最初のオープンソースデータセットである。
- 参考スコア(独自算出の注目度): 45.37867148457308
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crosstalk is a traditional Chinese theatrical performance art. It is commonly
performed by two performers in the form of a dialogue. With the typical
features of dialogues, crosstalks are also designed to be hilarious for the
purpose of amusing the audience. In this study, we introduce CrossDial, the
first open-source dataset containing most classic Chinese crosstalks crawled
from the Web. Moreover, we define two new tasks, provide two benchmarks, and
investigate the ability of current dialogue generation models in the field of
crosstalk generation. The experiment results and case studies demonstrate that
crosstalk generation is challenging for straightforward methods and remains an
interesting topic for future works.
- Abstract(参考訳): クロストーク(Crosstalk)は中国の伝統芸能である。
2人のパフォーマーが対話の形で演奏するのが一般的である。
対話の典型的な特徴により、クロストークは観客を楽しませる目的で笑えるようにデザインされている。
本研究では,Webからクロールされた中国の古典的クロストークを多く含むオープンソースデータセットであるCrossDialを紹介する。
さらに、2つの新しいタスクを定義し、2つのベンチマークを提供し、クロストーク生成分野における現在の対話生成モデルの能力について検討する。
実験結果とケーススタディにより,クロストーク生成は簡単な手法では困難であり,今後の研究において興味深い話題となっている。
関連論文リスト
- Searching for Snippets of Open-Domain Dialogue in Task-Oriented Dialogue
Datasets [0.0]
chit-chat/open domainダイアログは、ユーザとのソーシャルな会話に重点を置いている。
タスク指向の対話は、レストランの予約や飛行機のチケットの予約など、機能目標を表現する。
本研究は,ソーシャルトークに関連するシーケンスが自然に存在することを示し,chitchatをタスク指向対話に組み込む方法に関するさらなる研究を動機付けている。
論文 参考訳(メタデータ) (2023-11-23T16:08:39Z) - Conversation Chronicles: Towards Diverse Temporal and Relational
Dynamics in Multi-Session Conversations [9.249662593315541]
我々は,長期会話設定を実装するために,新たに100万件の多セッション対話データセットであるConversation Chroniclesを導入する。
会話年代記の対話エピソードは、一貫性と一貫した相互作用を維持しながら、それらの特性を反映していることを示す。
また、時系列要約と対話生成モジュールで構成されるReBotと呼ばれる対話モデルを提案する。
論文 参考訳(メタデータ) (2023-10-20T11:06:21Z) - Multi-turn Dialogue Comprehension from a Topic-aware Perspective [70.37126956655985]
本稿では,話題認識の観点から,マルチターン対話をモデル化することを提案する。
対話文のセグメント化アルゴリズムを用いて、対話文を教師なしの方法でトピック集中フラグメントに分割する。
また,トピックセグメントを処理要素として扱う新しいモデルとして,トピック認識デュアルアテンションマッチング(TADAM)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T11:03:55Z) - A Benchmark for Understanding and Generating Dialogue between Characters
in Stories [75.29466820496913]
本研究は,機械が物語の対話を理解・生成できるかどうかを探求する最初の研究である。
マスク付き対話生成と対話話者認識という2つの新しいタスクを提案する。
DialStoryの自動評価と手動評価で既存のモデルをテストすることで,提案課題の難しさを示す。
論文 参考訳(メタデータ) (2022-09-18T10:19:04Z) - Back to the Future: Bidirectional Information Decoupling Network for
Multi-turn Dialogue Modeling [80.51094098799736]
ユニバーサル対話エンコーダとして双方向情報デカップリングネットワーク(BiDeN)を提案する。
BiDeNは過去と将来の両方のコンテキストを明示的に取り入れており、幅広い対話関連のタスクに一般化することができる。
異なる下流タスクのデータセットに対する実験結果は、我々のBiDeNの普遍性と有効性を示している。
論文 参考訳(メタデータ) (2022-04-18T03:51:46Z) - Cross Copy Network for Dialogue Generation [44.593899479668416]
本稿では,現在の対話コンテキストと類似の対話インスタンスの論理構造を同時に探索する新しいネットワークアーキテクチャであるCross Copy Networks(CCN)を提案する。
裁判所の議論と顧客サービスコンテンツ生成という2つの課題による実験により,提案アルゴリズムは既存の最先端コンテンツ生成モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-10-22T09:03:23Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z) - CrossWOZ: A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue
Dataset [58.910961297314415]
CrossWOZは、中国のCross-Domain Wizard-of-Ozタスク指向データセットとしては初めての大規模である。
6K対話セッションと、ホテル、レストラン、アトラクション、メトロ、タクシーを含む5つのドメインの102K発話が含まれている。
論文 参考訳(メタデータ) (2020-02-27T03:06:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。