論文の概要: ParaQA: A Question Answering Dataset with Paraphrase Responses for
Single-Turn Conversation
- arxiv url: http://arxiv.org/abs/2103.07771v1
- Date: Sat, 13 Mar 2021 18:53:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 08:33:29.029522
- Title: ParaQA: A Question Answering Dataset with Paraphrase Responses for
Single-Turn Conversation
- Title(参考訳): paraqa: 単ターン会話のためのparaphrase応答付き質問応答データセット
- Authors: Endri Kacupaj, Barshana Banerjee, Kuldeep Singh, Jens Lehmann
- Abstract要約: ParaQAは知識グラフ(KG)上の1ターン会話のための複数のパラフレーズ応答を持つデータセットである
データセットは半自動的なフレームワークを使って、バックトランスレーションのようなテクニックを使って、さまざまな回答のパラフレージングを生成する。
- 参考スコア(独自算出の注目度): 5.087932295628364
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents ParaQA, a question answering (QA) dataset with multiple
paraphrased responses for single-turn conversation over knowledge graphs (KG).
The dataset was created using a semi-automated framework for generating diverse
paraphrasing of the answers using techniques such as back-translation. The
existing datasets for conversational question answering over KGs
(single-turn/multi-turn) focus on question paraphrasing and provide only up to
one answer verbalization. However, ParaQA contains 5000 question-answer pairs
with a minimum of two and a maximum of eight unique paraphrased responses for
each question. We complement the dataset with baseline models and illustrate
the advantage of having multiple paraphrased answers through commonly used
metrics such as BLEU and METEOR. The ParaQA dataset is publicly available on a
persistent URI for broader usage and adaptation in the research community.
- Abstract(参考訳): 本稿では,知識グラフ(KG)上での1ターン会話に対して,複数のパラフレーズ応答を持つ質問応答(QA)データセットParaQAを提案する。
データセットは半自動的なフレームワークを使って、バックトランスレーションのようなテクニックを使って、さまざまな回答のパラフレージングを生成する。
kgs(single-turn/multi-turn)を超える会話型質問応答のための既存のデータセットは、質問パラフレーズに注目し、最大1つの回答のみを提供する。
しかし、ParaQAには5000の質問応答対があり、各質問に対して最低2つ、最大8つの独自のパラフレーズ応答がある。
ベースラインモデルでデータセットを補完し、BLEUやMETEORといった一般的なメトリクスを通じて複数のパラフレーズの答えを持つ利点を示す。
ParaQAデータセットは、研究コミュニティで広く使用および適応するために、永続的なURIで公開されています。
関連論文リスト
- PCoQA: Persian Conversational Question Answering Dataset [12.07607688189035]
PCoQAデータセットは、9,026のコンテキスト駆動質問を含む情報検索ダイアログを含むリソースである。
PCoQAは、以前の質問応答データセットと比較して、新しい課題を示すように設計されている。
本稿では,PCoQAデータセットを包括的に提示するだけでなく,各種ベンチマークモデルの性能も報告する。
論文 参考訳(メタデータ) (2023-12-07T15:29:34Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - Conversational QA Dataset Generation with Answer Revision [2.5838973036257458]
本稿では,一節から質問に値するフレーズを抽出し,過去の会話を考慮し,それに対応する質問を生成する新しい枠組みを提案する。
本フレームワークでは,抽出した回答を質問生成後に修正し,その回答が一致した質問に正確に一致するようにした。
論文 参考訳(メタデータ) (2022-09-23T04:05:38Z) - An Answer Verbalization Dataset for Conversational Question Answerings
over Knowledge Graphs [9.979689965471428]
本稿では,既存のConvQAデータセットを言語化された回答で拡張することによって,最先端技術に寄与する。
5つのシーケンス・ツー・シーケンスモデルを用いて,文法的正しさを維持しながら応答生成実験を行った。
論文 参考訳(メタデータ) (2022-08-13T21:21:28Z) - ConditionalQA: A Complex Reading Comprehension Dataset with Conditional
Answers [93.55268936974971]
条件付き回答を含む複雑な質問を含む質問回答データセットについて述べる。
このデータセットを ConditionalQA と呼びます。
本稿では,既存のQAモデルの多く,特に回答条件の選択において,ConditionalQAは困難であることを示す。
論文 参考訳(メタデータ) (2021-10-13T17:16:46Z) - TopiOCQA: Open-domain Conversational Question Answeringwith Topic
Switching [11.717296856448566]
トピックスイッチ付きオープンドメイン会話データセットであるTopiOCQAをWikipediaで紹介する。
TopiOCQAには3,920の会話と情報検索の質問と自由形式の回答が含まれている。
我々は、最先端の文書検索手法とニューラルリーダーモデルを組み合わせることで、いくつかのベースラインを評価する。
論文 参考訳(メタデータ) (2021-10-02T09:53:48Z) - QAConv: Question Answering on Informative Conversations [85.2923607672282]
ビジネスメールやパネルディスカッション,作業チャネルなど,情報的な会話に重点を置いています。
合計で、スパンベース、フリーフォーム、および回答不能な質問を含む34,204のQAペアを収集します。
論文 参考訳(メタデータ) (2021-05-14T15:53:05Z) - GooAQ: Open Question Answering with Diverse Answer Types [63.06454855313667]
さまざまな回答型を持つ大規模データセットであるGooAQを紹介する。
このデータセットには500万の質問と300万の回答が含まれている。
論文 参考訳(メタデータ) (2021-04-18T05:40:39Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z) - Towards Data Distillation for End-to-end Spoken Conversational Question
Answering [65.124088336738]
音声対話型質問応答タスク(SCQA)を提案する。
SCQAは,音声発話とテキストコーパスから複雑な対話の流れをモデル化することを目的としている。
我々の主な目的は、音声とテキストの両方で会話的な質問に対処するQAシステムを構築することである。
論文 参考訳(メタデータ) (2020-10-18T05:53:39Z) - Fluent Response Generation for Conversational Question Answering [15.826109118064716]
本稿では,SEQ2SEQ NLGアプローチで応答をシチュレートする手法を提案する。
我々は、エンドツーエンドシステムのトレーニングデータを生成するためにデータ拡張を使用します。
論文 参考訳(メタデータ) (2020-05-21T04:57:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。