論文の概要: MultiDoc2Dial: Modeling Dialogues Grounded in Multiple Documents
- arxiv url: http://arxiv.org/abs/2109.12595v1
- Date: Sun, 26 Sep 2021 13:12:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-29 10:57:22.775214
- Title: MultiDoc2Dial: Modeling Dialogues Grounded in Multiple Documents
- Title(参考訳): multidoc2dial: 複数の文書に基づいた対話のモデリング
- Authors: Song Feng and Siva Sankalp Patel and Hui Wan and Sachindra Joshi
- Abstract要約: 複数の文書に基盤を置き、目的指向対話をモデル化するための新しいタスクとデータセットであるMultiDoc2Dialを提案する。
4つの異なるドメインから複数のドキュメントにグラウンド化された対話を含む新しいデータセットを導入する。
- 参考スコア(独自算出の注目度): 14.807409907211452
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose MultiDoc2Dial, a new task and dataset on modeling goal-oriented
dialogues grounded in multiple documents. Most previous works treat
document-grounded dialogue modeling as a machine reading comprehension task
based on a single given document or passage. In this work, we aim to address
more realistic scenarios where a goal-oriented information-seeking conversation
involves multiple topics, and hence is grounded on different documents. To
facilitate such a task, we introduce a new dataset that contains dialogues
grounded in multiple documents from four different domains. We also explore
modeling the dialogue-based and document-based context in the dataset. We
present strong baseline approaches and various experimental results, aiming to
support further research efforts on such a task.
- Abstract(参考訳): 本稿では,目標指向対話のモデル化に関する新しいタスクとデータセットであるmultidoc2dialを提案する。
以前の作品のほとんどは、与えられた1つの文書または節に基づく理解タスクを読む機械として、文書化された対話モデリングを扱う。
本研究では,目的指向の情報参照会話が複数のトピックを含む,より現実的なシナリオに対処し,それゆえ,異なる文書を基盤としている。
このような作業を容易にするために,4つの異なるドメインから複数の文書に接頭した対話を含む新しいデータセットを提案する。
また、データセット内の対話ベースおよび文書ベースのコンテキストのモデリングについても検討する。
我々は,このような課題に対するさらなる研究を支援するために,強力なベースラインアプローチと様々な実験結果を提案する。
関連論文リスト
- Unified Multi-Modal Interleaved Document Representation for Information Retrieval [57.65409208879344]
我々は、異なるモダリティでインターリーブされた文書を均等に埋め込み、より包括的でニュアンスのある文書表現を生成する。
具体的には、テキスト、画像、テーブルの処理と統合を統一されたフォーマットと表現に統合する、近年のビジョン言語モデルの能力を活用して、これを実現する。
論文 参考訳(メタデータ) (2024-10-03T17:49:09Z) - DialogStudio: Towards Richest and Most Diverse Unified Dataset
Collection for Conversational AI [92.29874802394167]
DialogStudioは対話データセットの最大かつ最も多様なコレクションである。
本コレクションは,オープンドメイン対話,タスク指向対話,自然言語理解,対話レコメンデーション,対話要約,知識基底対話などのデータを含む。
論文 参考訳(メタデータ) (2023-07-19T17:57:53Z) - Doc2Bot: Accessing Heterogeneous Documents via Conversational Bots [103.54897676954091]
Doc2Botは、ユーザーが会話を通じて情報を求めるのを助けるマシンを構築するためのデータセットである。
われわれのデータセットには、5つのドメインの中国の文書に基づく10万回以上のターンが含まれている。
論文 参考訳(メタデータ) (2022-10-20T07:33:05Z) - Manual-Guided Dialogue for Flexible Conversational Agents [84.46598430403886]
対話データを効率的に構築し、利用する方法や、さまざまなドメインにモデルを大規模にデプロイする方法は、タスク指向の対話システムを構築する上で重要な問題である。
エージェントは対話とマニュアルの両方からタスクを学習する。
提案手法は,詳細なドメインオントロジーに対する対話モデルの依存性を低減し,様々なドメインへの適応をより柔軟にする。
論文 参考訳(メタデータ) (2022-08-16T08:21:12Z) - DialogZoo: Large-Scale Dialog-Oriented Task Learning [52.18193690394549]
我々は,多種多様な対話課題を解くための統合基盤モデルの構築を目指している。
この目的を達成するために、73の公開データセットから、まず大規模なラベル付き対話データセットを収集する。
論文 参考訳(メタデータ) (2022-05-25T11:17:16Z) - Constructing Multi-Modal Dialogue Dataset by Replacing Text with
Semantically Relevant Images [17.076424447172297]
本稿では,人間の介入を最小限に抑えた45kマルチモーダル対話データセットを提案する。
このようなデータセットを作成する方法は,(1)テキスト対話データセットの作成と前処理,(2)テキストから画像への置き換え技術による画像混合対話の作成,(3)文脈相似性に基づくフィルタリング手法を用いて構成する。
論文 参考訳(メタデータ) (2021-07-19T08:44:11Z) - Converse, Focus and Guess -- Towards Multi-Document Driven Dialogue [53.380996227212165]
本稿では,対話を指導することで,ユーザが興味を持っている対象文書をエージェントが推測できる,MD3(Multi-Document Driven Dialogue)を提案する。
GuessMovieには16,881の文書があり、それぞれが映画と関連する13,434の対話を記述している。
提案手法はいくつかの強力なベースライン法よりも優れており,人間の性能に非常に近い。
論文 参考訳(メタデータ) (2021-02-04T06:36:11Z) - doc2dial: A Goal-Oriented Document-Grounded Dialogue Dataset [24.040517978408484]
doc2dialは、ドキュメントに基礎を置いたゴール指向の対話の新しいデータセットである。
まず、テキストセクション間の高レベルな関係に対応するコンテンツ要素に基づいて対話フローを構築する。
我々は,これらの対話フローを参加者に提示し,会話音声を作成する。
論文 参考訳(メタデータ) (2020-11-12T19:08:44Z) - Towards a Multi-modal, Multi-task Learning based Pre-training Framework
for Document Representation Learning [5.109216329453963]
本稿では,新しい事前学習タスクとして,文書トピックモデリングと文書シャッフル予測を導入する。
本稿では,Longformer ネットワークアーキテクチャをバックボーンとして,複数ページの文書からのマルチモーダル情報をエンド・ツー・エンドで符号化する。
論文 参考訳(メタデータ) (2020-09-30T05:39:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。