論文の概要: DCH-2: A Parallel Customer-Helpdesk Dialogue Corpus with Distributions
of Annotators' Labels
- arxiv url: http://arxiv.org/abs/2104.08755v1
- Date: Sun, 18 Apr 2021 07:35:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 10:18:56.826158
- Title: DCH-2: A Parallel Customer-Helpdesk Dialogue Corpus with Distributions
of Annotators' Labels
- Title(参考訳): DCH-2:アノテータラベルの分布を考慮した並列顧客ヘルプデスク対話コーパス
- Authors: Zhaohao Zeng and Tetsuya Sakai
- Abstract要約: DCH-2と呼ばれるデータセットは、中国語で4,390の実際の顧客-ヘルプデスク対話とその英訳を含む。
データセットは NTCIR-14 Short Text Conversation と NTCIR-15 Dialogue Evaluation タスクのオーガナイザとして構築されました。
- 参考スコア(独自算出の注目度): 26.95034620993314
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We introduce a data set called DCH-2, which contains 4,390 real
customer-helpdesk dialogues in Chinese and their English translations. DCH-2
also contains dialogue-level annotations and turn-level annotations obtained
independently from either 19 or 20 annotators. The data set was built through
our effort as organisers of the NTCIR-14 Short Text Conversation and NTCIR-15
Dialogue Evaluation tasks, to help researchers understand what constitutes an
effective customer-helpdesk dialogue, and thereby build efficient and helpful
helpdesk systems that are available to customers at all times. In addition,
DCH-2 may be utilised for other purposes, for example, as a repository for
retrieval-based dialogue systems, or as a parallel corpus for machine
translation in the helpdesk domain.
- Abstract(参考訳): DCH-2と呼ばれるデータセットは、中国語で4,390の実際の顧客-ヘルプデスク対話とその英訳を含む。
DCH-2はまた、19または20のアノテーションから独立して得られる対話レベルのアノテーションとターンレベルのアノテーションを含んでいる。
このデータセットは、ntcir-14ショートテキスト会話とntcir-15対話評価タスクのオーガナイザとして構築され、研究者が効果的な顧客-ヘルプデスク対話を構成するものを理解し、顧客に対して常に利用可能な効率的で有用なヘルプデスクシステムを構築するのに役立ちます。
さらに、dch-2は検索ベースの対話システムのリポジトリとして、あるいはヘルプデスクドメインの機械翻訳のための並列コーパスとして、他の目的にも利用できる。
関連論文リスト
- IndoToD: A Multi-Domain Indonesian Benchmark For End-to-End
Task-Oriented Dialogue Systems [26.094144160398447]
本稿ではインドネシアのマルチドメインToDベンチマークであるIndoToDを紹介する。
2つの英語のToDデータセットをインドネシア語に拡張し、4つの異なるドメインをデレキシライズしてアノテーションのサイズを効率的に削減する。
高品質なデータ収集を保証するため、対話を手動で翻訳するためにネイティブな話者を雇います。
論文 参考訳(メタデータ) (2023-11-02T03:01:53Z) - SuperDialseg: A Large-scale Dataset for Supervised Dialogue Segmentation [55.82577086422923]
文書地上対話の助けを借りて,対話のセグメンテーションポイントを実現可能な定義を提供する。
我々は,9,478の対話を含むSuperDialsegと呼ばれる大規模教師付きデータセットをリリースする。
また、対話セグメンテーションタスクの5つのカテゴリにまたがる18のモデルを含むベンチマークも提供する。
論文 参考訳(メタデータ) (2023-05-15T06:08:01Z) - Instruction Clarification Requests in Multimodal Collaborative Dialogue
Games: Tasks, and an Analysis of the CoDraw Dataset [17.285206913252786]
本稿では,CoDrawにおける命令明確化要求(iCR)について解説する。
プレイヤーが自己動機的に生成する語彙的および意味論的に多様なiCRを含むことを示す。
次に、iCRの作成時期と認識方法の2つのタスクのベースラインモデルを定式化し、提供します。
論文 参考訳(メタデータ) (2023-02-28T08:41:53Z) - DialogQAE: N-to-N Question Answer Pair Extraction from Customer Service
Chatlog [34.69426306212259]
そこで,N-to-NQA抽出タスクを提案する。
5つのカスタマサービスデータセット上で良好に機能する、エンドツーエンドと2段階のバリエーションを備えた、生成的/識別的タグ付けベースの一連の方法を紹介します。
論文 参考訳(メタデータ) (2022-12-14T09:05:14Z) - Manual-Guided Dialogue for Flexible Conversational Agents [84.46598430403886]
対話データを効率的に構築し、利用する方法や、さまざまなドメインにモデルを大規模にデプロイする方法は、タスク指向の対話システムを構築する上で重要な問題である。
エージェントは対話とマニュアルの両方からタスクを学習する。
提案手法は,詳細なドメインオントロジーに対する対話モデルの依存性を低減し,様々なドメインへの適応をより柔軟にする。
論文 参考訳(メタデータ) (2022-08-16T08:21:12Z) - CookDial: A dataset for task-oriented dialogs grounded in procedural
documents [21.431615439267734]
本研究は、手続き的知識理解を伴うタスク指向対話システムの研究を容易にする新しいダイアログデータセットであるCookDialを提案する。
コーパスは、260人の人対人タスク指向のダイアログを含み、エージェントがレシピドキュメントを与えられた場合、ユーザが料理を調理するように誘導する。
CookDialのダイアログには、 (i) ダイアログフローとサポートドキュメントの間の手続き的アライメント、 (ii) 長い文のセグメンテーション、ハードインストラクションのパラフレーズ化、およびダイアログコンテキストにおけるコア推論の解決を含む複雑なエージェント決定の2つの特徴がある。
論文 参考訳(メタデータ) (2022-06-17T12:23:53Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - UniDS: A Unified Dialogue System for Chit-Chat and Task-oriented
Dialogues [59.499965460525694]
上記の2つのスキルを備えた統合対話システム(UniDS)を提案する。
我々は、チャットとタスク指向の対話の両方に対応可能な統合対話データスキーマを設計する。
我々は、事前訓練されたチャット対話モデルから混合対話データでUniDSを訓練する。
論文 参考訳(メタデータ) (2021-10-15T11:56:47Z) - Overview of the Ninth Dialog System Technology Challenge: DSTC9 [111.35889309106359]
第9回対話システム技術チャレンジ(DSTC-9)は、対話システムにおける4つの異なるタスクにエンドツーエンドの対話技術を適用することに焦点を当てている。
本稿では,各トラックのタスク定義,データセット,ベースライン,評価設定について述べる。
論文 参考訳(メタデータ) (2020-11-12T16:43:10Z) - Conversation Learner -- A Machine Teaching Tool for Building Dialog
Managers for Task-Oriented Dialog Systems [57.082447660944965]
Conversation Learnerは、ダイアログマネージャを構築するための機械学習ツールである。
ダイアログ作成者が慣れ親しんだツールを使ってダイアログフローを作成し、ダイアログフローをパラメトリックモデルに変換することができる。
ユーザシステムダイアログをトレーニングデータとして活用することで、ダイアログ作成者が時間とともにダイアログマネージャを改善することができる。
論文 参考訳(メタデータ) (2020-04-09T00:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。