論文の概要: Open-Domain Question Answering Goes Conversational via Question
Rewriting
- arxiv url: http://arxiv.org/abs/2010.04898v3
- Date: Wed, 14 Apr 2021 19:09:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-10-08 23:20:33.538470
- Title: Open-Domain Question Answering Goes Conversational via Question
Rewriting
- Title(参考訳): Open-Domain Question Answeringは質問の書き直しを通じて会話ができる
- Authors: Raviteja Anantha, Svitlana Vakulenko, Zhucheng Tu, Shayne Longpre,
Stephen Pulman, Srinivas Chappidi
- Abstract要約: 会話コンテキストにおける質問書き直しのための新しいデータセット(QreCC)を導入する。
QReCCの課題は、1000万のWebページの集合の中で会話による質問に対する答えを見つけることである。
以上の結果から,QReCCデータセットの最初のベースラインはF1が19.10であり,人間の上限が75.45であるのに対して,セットアップの困難さと改善の余地が大きいことが示唆された。
- 参考スコア(独自算出の注目度): 15.174807142080192
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a new dataset for Question Rewriting in Conversational Context
(QReCC), which contains 14K conversations with 80K question-answer pairs. The
task in QReCC is to find answers to conversational questions within a
collection of 10M web pages (split into 54M passages). Answers to questions in
the same conversation may be distributed across several web pages. QReCC
provides annotations that allow us to train and evaluate individual subtasks of
question rewriting, passage retrieval and reading comprehension required for
the end-to-end conversational question answering (QA) task. We report the
effectiveness of a strong baseline approach that combines the state-of-the-art
model for question rewriting, and competitive models for open-domain QA. Our
results set the first baseline for the QReCC dataset with F1 of 19.10, compared
to the human upper bound of 75.45, indicating the difficulty of the setup and a
large room for improvement.
- Abstract(参考訳): 我々は,8k問答対と1万4千の会話を含む会話文脈における質問書き換えのための新しいデータセット(qrecc)を提案する。
qreccのタスクは、1000万のwebページの集合の中で会話的な質問に対する答えを見つけることである。
同じ会話における質問に対する回答は、複数のウェブページに分散することができる。
QReCCは、エンドツーエンドの対話型質問応答(QA)タスクに必要な質問書き直し、通過検索、読解の個別サブタスクをトレーニングし、評価するためのアノテーションを提供する。
質問書き直しのための最先端モデルとオープンドメインQAのための競合モデルを組み合わせた,強力なベースラインアプローチの有効性を報告する。
以上の結果から,QReCCデータセットの最初のベースラインはF1が19.10であり,人間の上限が75.45であるのに対し,セットアップの困難さと改善の余地が大きいことが示唆された。
関連論文リスト
- MeeQA: Natural Questions in Meeting Transcripts [3.383670923637875]
本稿では,自然言語による質問応答のデータセットであるMeeQAについて述べる。
データセットには48Kの質問応答ペアが含まれ、422のミーティングスクリプタから抽出される。
論文 参考訳(メタデータ) (2023-05-15T10:02:47Z) - Conversational QA Dataset Generation with Answer Revision [2.5838973036257458]
本稿では,一節から質問に値するフレーズを抽出し,過去の会話を考慮し,それに対応する質問を生成する新しい枠組みを提案する。
本フレームワークでは,抽出した回答を質問生成後に修正し,その回答が一致した質問に正確に一致するようにした。
論文 参考訳(メタデータ) (2022-09-23T04:05:38Z) - Multifaceted Improvements for Conversational Open-Domain Question
Answering [54.913313912927045]
対話型オープンドメイン質問回答(MICQA)のための多面的改善フレームワークを提案する。
第一に、提案したKL分割に基づく正規化は、検索と解答のためのより良い質問理解をもたらすことができる。
第二に、追加されたポストランカモジュールは、より関連性の高いパスをトップにプッシュし、2アスペクトの制約で読者に選択できる。
第3に、十分に設計されたカリキュラム学習戦略は、訓練と推論の黄金の通路設定のギャップを効果的に狭め、黄金の通路支援なしで真の答えを見つけることを奨励する。
論文 参考訳(メタデータ) (2022-04-01T07:54:27Z) - QAConv: Question Answering on Informative Conversations [85.2923607672282]
ビジネスメールやパネルディスカッション,作業チャネルなど,情報的な会話に重点を置いています。
合計で、スパンベース、フリーフォーム、および回答不能な質問を含む34,204のQAペアを収集します。
論文 参考訳(メタデータ) (2021-05-14T15:53:05Z) - A Graph-guided Multi-round Retrieval Method for Conversational
Open-domain Question Answering [52.041815783025186]
本稿では,会話のターン間の回答間の関係をモデル化するグラフ誘導検索手法を提案する。
また,検索コンテキストが現在の質問理解に与える影響を検討するために,マルチラウンド関連フィードバック手法を導入することを提案する。
論文 参考訳(メタデータ) (2021-04-17T04:39:41Z) - ParaQA: A Question Answering Dataset with Paraphrase Responses for
Single-Turn Conversation [5.087932295628364]
ParaQAは知識グラフ(KG)上の1ターン会話のための複数のパラフレーズ応答を持つデータセットである
データセットは半自動的なフレームワークを使って、バックトランスレーションのようなテクニックを使って、さまざまな回答のパラフレージングを生成する。
論文 参考訳(メタデータ) (2021-03-13T18:53:07Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z) - Towards Data Distillation for End-to-end Spoken Conversational Question
Answering [65.124088336738]
音声対話型質問応答タスク(SCQA)を提案する。
SCQAは,音声発話とテキストコーパスから複雑な対話の流れをモデル化することを目的としている。
我々の主な目的は、音声とテキストの両方で会話的な質問に対処するQAシステムを構築することである。
論文 参考訳(メタデータ) (2020-10-18T05:53:39Z) - Answering Any-hop Open-domain Questions with Iterative Document
Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。
提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文 参考訳(メタデータ) (2020-09-16T04:31:38Z) - Question Rewriting for Conversational Question Answering [15.355557454305776]
本稿では,TREC CAsT 2019パス検索データセット上で,新たな技術状況を設定する対話型QAアーキテクチャを提案する。
また,同じQRモデルにより,QACデータセットのQA性能が向上することを示す。
評価の結果,QRモデルは両データセットにおいてほぼ人間レベルの性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2020-04-30T09:27:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。