論文の概要: Action-Based Conversations Dataset: A Corpus for Building More In-Depth
Task-Oriented Dialogue Systems
- arxiv url: http://arxiv.org/abs/2104.00783v1
- Date: Thu, 1 Apr 2021 22:04:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 00:05:32.331257
- Title: Action-Based Conversations Dataset: A Corpus for Building More In-Depth
Task-Oriented Dialogue Systems
- Title(参考訳): アクションベースの会話データセット:より深いタスク指向対話システムを構築するコーパス
- Authors: Derek Chen, Howard Chen, Yi Yang, Alex Lin, Zhou Yu
- Abstract要約: 55の異なるユーザインテントを含む10K以上の人間と人間の対話を持つAction-Based Conversationsデータセットを紹介します。
アクションステートトラッキングとカスケーディングダイアログサクセスという2つの追加のダイアログタスクを提案し、一連のベースラインを確立します。
実験の結果、より洗練されたネットワークはより単純なモデルよりも優れているが、abcdの人間レベルの性能に到達するためのかなりのギャップ(絶対精度50.8%)が存在することが示されている。
- 参考スコア(独自算出の注目度): 47.45333978381135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing goal-oriented dialogue datasets focus mainly on identifying slots
and values. However, customer support interactions in reality often involve
agents following multi-step procedures derived from explicitly-defined company
policies as well. To study customer service dialogue systems in more realistic
settings, we introduce the Action-Based Conversations Dataset (ABCD), a
fully-labeled dataset with over 10K human-to-human dialogues containing 55
distinct user intents requiring unique sequences of actions constrained by
policies to achieve task success. We propose two additional dialog tasks,
Action State Tracking and Cascading Dialogue Success, and establish a series of
baselines involving large-scale, pre-trained language models on this dataset.
Empirical results demonstrate that while more sophisticated networks outperform
simpler models, a considerable gap (50.8% absolute accuracy) still exists to
reach human-level performance on ABCD.
- Abstract(参考訳): 既存の目標指向の対話データセットは主にスロットと値の識別に焦点を当てている。
しかし、実際には顧客サポートのやりとりには、明確に定義された企業ポリシーから派生した多段階の手順に従うエージェントが伴うことが多い。
顧客サービス対話システムをより現実的な設定で研究するために、タスク成功を達成するためにポリシーによって制約されたアクションのユニークなシーケンスを必要とする55の異なるユーザの意図を含む1万以上の人対人対話を備えた、完全なラベル付きデータセットであるaction-based conversation dataset(abcd)を紹介します。
本稿では,2つのダイアログタスク,Action State TrackingとCascading Dialogue Successを提案し,このデータセット上で大規模で事前訓練された言語モデルを含む一連のベースラインを確立する。
実験の結果、より洗練されたネットワークはより単純なモデルよりも優れているが、abcdの人間レベルの性能に到達するためのかなりのギャップ(絶対精度50.8%)が存在することが示されている。
関連論文リスト
- DFlow: Diverse Dialogue Flow Simulation with Large Language Models [16.209331014315463]
本稿では,合成対話の多様性を高めるために,新たなデータ拡張手法を提案する。
我々は、15の異なる領域に3,886の対話フローからなるタスク指向対話データセットを生成する。
論文 参考訳(メタデータ) (2024-10-18T20:35:28Z) - Leveraging Explicit Procedural Instructions for Data-Efficient Action
Prediction [5.448684866061922]
タスク指向の対話は、しばしばエージェントがユーザ要求を満たすために複雑で多段階の手順を実行する必要がある。
大規模言語モデルは、制約のある環境でこれらの対話を自動化することに成功したが、その広範な展開は、トレーニングに必要なタスク固有の大量のデータによって制限されている。
本稿では,エージェントガイドラインから導出した明示的な指示を利用して対話システムを構築するための,データ効率のよいソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-06T18:42:08Z) - SpokenWOZ: A Large-Scale Speech-Text Benchmark for Spoken Task-Oriented
Dialogue Agents [72.42049370297849]
SpokenWOZは音声TODのための大規模音声テキストデータセットである。
SpokenWOZでは、クロスターンスロットと推論スロット検出が新たな課題である。
論文 参考訳(メタデータ) (2023-05-22T13:47:51Z) - SuperDialseg: A Large-scale Dataset for Supervised Dialogue Segmentation [55.82577086422923]
文書地上対話の助けを借りて,対話のセグメンテーションポイントを実現可能な定義を提供する。
我々は,9,478の対話を含むSuperDialsegと呼ばれる大規模教師付きデータセットをリリースする。
また、対話セグメンテーションタスクの5つのカテゴリにまたがる18のモデルを含むベンチマークも提供する。
論文 参考訳(メタデータ) (2023-05-15T06:08:01Z) - Discovering Customer-Service Dialog System with Semi-Supervised Learning
and Coarse-to-Fine Intent Detection [6.869753194843482]
タスク指向ダイアログは,マルチターン会話による特定の目標達成を支援することを目的としている。
教師/学生のパラダイムに基づいた弱教師付きデータセットを構築した。
また,ユーザ意図を検出するために,モジュール型対話システムと粗粒度分類を統合した。
論文 参考訳(メタデータ) (2022-12-23T14:36:43Z) - Dialog Acts for Task-Driven Embodied Agents [10.275619475149433]
エージェントは自然言語の理解タスク記述で対話し、適切なフォローアップ質問をすることができる必要がある。
このような対話をモデル化するためのダイアログのセットを提案し、3000以上のタスク指向の会話を含むTEAChデータセットに注釈を付ける。
この注釈付きデータセットを、与えられた発話のダイアログ動作にタグ付けし、ダイアログ履歴を与えられた次の応答のダイアログ動作を予測する訓練モデルに使用し、ダイアログ動作を使用してエージェントの非ダイアログ動作をガイドする。
論文 参考訳(メタデータ) (2022-09-26T18:41:28Z) - DialogZoo: Large-Scale Dialog-Oriented Task Learning [52.18193690394549]
我々は,多種多様な対話課題を解くための統合基盤モデルの構築を目指している。
この目的を達成するために、73の公開データセットから、まず大規模なラベル付き対話データセットを収集する。
論文 参考訳(メタデータ) (2022-05-25T11:17:16Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - Modeling Long Context for Task-Oriented Dialogue State Generation [51.044300192906995]
本稿では,シンプルで効果的な発話タグ付け手法と双方向言語モデルを用いたマルチタスク学習モデルを提案する。
提案手法は,入力対話コンテキストシーケンスが長い場合に,ベースラインの性能が著しく低下する,という問題を解決する。
本実験では,MultiWOZ 2.0データセットにおいて,ベースラインに対して7.03%の相対的改善を実現し,新しい最先端のジョイントゴール精度を52.04%に設定した。
論文 参考訳(メタデータ) (2020-04-29T11:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。