論文の概要: Task2Dial: A Novel Task and Dataset for Commonsense enhanced Task-based
Dialogue Grounded in Documents
- arxiv url: http://arxiv.org/abs/2204.01061v1
- Date: Sun, 3 Apr 2022 12:15:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 08:14:35.614445
- Title: Task2Dial: A Novel Task and Dataset for Commonsense enhanced Task-based
Dialogue Grounded in Documents
- Title(参考訳): task2dial: コモンセンス強化タスクベース対話のための新しいタスクとデータセット
- Authors: Carl Strathearn and Dimitra Gkatzia
- Abstract要約: 本稿では,文書に埋もれたコモンセンス強化タスクベース対話に関する新しい課題を提案する。
Task2Dialデータセットは、文書ベースのタスクベースの対話の新しいデータセットである。
- 参考スコア(独自算出の注目度): 0.304585143845864
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a novel task on commonsense-enhanced task-based dialogue
grounded in documents and describes the Task2Dial dataset, a novel dataset of
document-grounded task-based dialogues, where an Information Giver (IG)
provides instructions (by consulting a document) to an Information Follower
(IF), so that the latter can successfully complete the task. In this unique
setting, the IF can ask clarification questions which may not be grounded in
the underlying document and require commonsense knowledge to be answered. The
Task2Dial dataset poses new challenges: (1) its human reference texts show more
lexical richness and variation than other document-grounded dialogue datasets;
(2) generating from this set requires paraphrasing as instructional responses
might have been modified from the underlying document; (3) requires commonsense
knowledge, since questions might not necessarily be grounded in the document;
(4) generating requires planning based on context, as task steps need to be
provided in order. The Task2Dial dataset contains dialogues with an average
$18.15$ number of turns and 19.79 tokens per turn, as compared to 12.94 and 12
respectively in existing datasets. As such, learning from this dataset promises
more natural, varied and less template-like system utterances.
- Abstract(参考訳): 本稿では,コモンセンスエンハンスドタスクベースの対話を文書に基礎づけた新しいタスクについて述べるとともに,タスク2ディアルデータセットについて述べる。そこでは情報提供者(ig)が情報従者(if)に指示(文書を相談することで)を提供し,その処理を成功させる。
このユニークな設定では、IFは、基礎となる文書に根拠がなく、答えるために常識知識を必要とする、明確化の質問をすることができる。
Task2Dial データセットは、(1) 人間の参照テキストは、他の文書地上の対話データセットよりもより語彙的なリッチさとバリエーションを示し、(2) このセットから生成するには、基礎となる文書から命令応答が修正された場合のパラフレーズを必要とする、(3) 質問は必ずしも文書に基礎づけられるとは限らないため、常識的な知識を必要とする、(4) タスクステップを順に提供する必要がある、といった、新しい課題を提起する。
task2dialデータセットは、既存のデータセットの12.94と12に対して、平均18.15$のターン数と19.79トークンの対話を含んでいる。
このように、このデータセットからの学習は、より自然で、多様で、テンプレートライクなシステム発話が少ないことを約束します。
関連論文リスト
- Leverage Task Context for Object Affordance Ranking [57.59106517732223]
25の共通タスク、50k以上の画像、661k以上のオブジェクトからなる、最初の大規模タスク指向のアベイランスランキングデータセットを構築しました。
その結果,タスクコンテキストに基づくアベイランス学習のパラダイムの実現可能性と,サリエンシランキングやマルチモーダルオブジェクト検出の分野における最先端モデルよりも,我々のモデルの方が優れていることが示された。
論文 参考訳(メタデータ) (2024-11-25T04:22:33Z) - The Power of Summary-Source Alignments [62.76959473193149]
多文書要約(MDS)は難しい課題であり、しばしばサリエンスと冗長性検出のサブタスクに分解される。
参照要約とそのソース文書間の対応する文のアライメントを利用して、トレーニングデータを生成する。
本稿では,よりきめ細かな提案スパンレベルで適用することで,要約ソースアライメントフレームワークを拡張することを提案する。
論文 参考訳(メタデータ) (2024-06-02T19:35:19Z) - CREATIVESUMM: Shared Task on Automatic Summarization for Creative
Writing [90.58269243992318]
本稿では,複数の創作分野,すなわち文学テキスト,映画脚本,テレビ脚本を要約する作業について紹介する。
4つのサブタスクとその対応するデータセットを導入し、本、映画脚本、プライムタイムテレビ脚本、昼間のソープオペラ脚本の要約に焦点を当てた。
COING 2022でのCREATIVESUMMワークショップの一環として、共有タスクには合計18の応募が寄せられた。
論文 参考訳(メタデータ) (2022-11-10T21:31:03Z) - Doc2Bot: Accessing Heterogeneous Documents via Conversational Bots [103.54897676954091]
Doc2Botは、ユーザーが会話を通じて情報を求めるのを助けるマシンを構築するためのデータセットである。
われわれのデータセットには、5つのドメインの中国の文書に基づく10万回以上のターンが含まれている。
論文 参考訳(メタデータ) (2022-10-20T07:33:05Z) - FETA: A Benchmark for Few-Sample Task Transfer in Open-Domain Dialogue [70.65782786401257]
本研究は、オープンドメイン対話における少数サンプルタスク転送のベンチマークであるFETAを導入することにより、対話型タスク転送について検討する。
FETAには10タスクと7タスクがアノテートされた2つの基礎的な会話が含まれており、データセット内タスク転送の研究を可能にする。
3つの人気のある言語モデルと3つの学習アルゴリズムを用いて、132のソースターゲットタスクペア間の転送可能性を分析する。
論文 参考訳(メタデータ) (2022-05-12T17:59:00Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - MultiDoc2Dial: Modeling Dialogues Grounded in Multiple Documents [14.807409907211452]
複数の文書に基盤を置き、目的指向対話をモデル化するための新しいタスクとデータセットであるMultiDoc2Dialを提案する。
4つの異なるドメインから複数のドキュメントにグラウンド化された対話を含む新しいデータセットを導入する。
論文 参考訳(メタデータ) (2021-09-26T13:12:05Z) - doc2dial: A Goal-Oriented Document-Grounded Dialogue Dataset [24.040517978408484]
doc2dialは、ドキュメントに基礎を置いたゴール指向の対話の新しいデータセットである。
まず、テキストセクション間の高レベルな関係に対応するコンテンツ要素に基づいて対話フローを構築する。
我々は,これらの対話フローを参加者に提示し,会話音声を作成する。
論文 参考訳(メタデータ) (2020-11-12T19:08:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。