論文の概要: PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge
Graph
- arxiv url: http://arxiv.org/abs/2106.14167v1
- Date: Sun, 27 Jun 2021 08:21:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-30 04:46:49.155514
- Title: PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge
Graph
- Title(参考訳): PeCoQ: 知識グラフに関するペルシアの複雑な質問に対する回答データセット
- Authors: Romina Etezadi, Mehrnoush Shamsfard
- Abstract要約: 本稿では,ペルシャ語質問応答のためのデータセットである textitPeCoQ を紹介する。
このデータセットには、ペルシャの知識グラフであるFarsBaseから抽出された1万の複雑な質問と回答が含まれている。
データセットには、マルチリレーション、マルチエンタリティ、順序性、時間的制約など、さまざまな種類の複雑さがある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Question answering systems may find the answers to users' questions from
either unstructured texts or structured data such as knowledge graphs.
Answering questions using supervised learning approaches including deep
learning models need large training datasets. In recent years, some datasets
have been presented for the task of Question answering over knowledge graphs,
which is the focus of this paper. Although many datasets in English were
proposed, there have been a few question-answering datasets in Persian. This
paper introduces \textit{PeCoQ}, a dataset for Persian question answering. This
dataset contains 10,000 complex questions and answers extracted from the
Persian knowledge graph, FarsBase. For each question, the SPARQL query and two
paraphrases that were written by linguists are provided as well. There are
different types of complexities in the dataset, such as multi-relation,
multi-entity, ordinal, and temporal constraints. In this paper, we discuss the
dataset's characteristics and describe our methodology for building it.
- Abstract(参考訳): 質問応答システムは、構造化されていないテキストや知識グラフのような構造化データからユーザーの質問に対する答えを見つけることができる。
ディープラーニングモデルを含む教師付き学習アプローチを使って質問に答えるには、大規模なトレーニングデータセットが必要である。
近年,知識グラフに対する質問応答の課題として,いくつかのデータセットが提示されており,これが本論文の焦点となっている。
英語で多くのデータセットが提案されたが、ペルシア語ではいくつかの質問応答データセットがあった。
本稿では,ペルシャ質問応答のためのデータセットである \textit{pecoq} を紹介する。
このデータセットには、ペルシャの知識グラフであるFarsBaseから抽出された1万の複雑な質問と回答が含まれている。
各質問には、言語学者によって書かれたSPARQLクエリと2つのパラフレーズも提供されている。
データセットには、マルチリレーション、マルチエンタリティ、順序性、時間的制約など、さまざまな種類の複雑さがある。
本稿では,データセットの特徴について論じ,その構築方法について述べる。
関連論文リスト
- PCoQA: Persian Conversational Question Answering Dataset [12.07607688189035]
PCoQAデータセットは、9,026のコンテキスト駆動質問を含む情報検索ダイアログを含むリソースである。
PCoQAは、以前の質問応答データセットと比較して、新しい課題を示すように設計されている。
本稿では,PCoQAデータセットを包括的に提示するだけでなく,各種ベンチマークモデルの性能も報告する。
論文 参考訳(メタデータ) (2023-12-07T15:29:34Z) - IslamicPCQA: A Dataset for Persian Multi-hop Complex Question Answering
in Islamic Text Resources [0.0]
本稿では,非構造化情報ソースに基づく複雑な質問に回答するためのISISPCQAデータセットを紹介する。
準備されたデータセットは、幅広いイスラムのトピックをカバーし、このテーマの中で複雑なペルシアの質問への答えを容易にすることを目的としている。
論文 参考訳(メタデータ) (2023-04-23T14:20:58Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - ConditionalQA: A Complex Reading Comprehension Dataset with Conditional
Answers [93.55268936974971]
条件付き回答を含む複雑な質問を含む質問回答データセットについて述べる。
このデータセットを ConditionalQA と呼びます。
本稿では,既存のQAモデルの多く,特に回答条件の選択において,ConditionalQAは困難であることを示す。
論文 参考訳(メタデータ) (2021-10-13T17:16:46Z) - A Knowledge-based Approach for Answering Complex Questions in Persian [0.0]
ペルシャ語における複雑な質問に答えるための知識に基づくアプローチを提案する。
対応可能な論理形式の集合を構築することで,多制約および多ホップ問題を扱う。
質問に対する答えは、知識グラフから抽出された論理形式への答えから作られる。
論文 参考訳(メタデータ) (2021-07-05T14:01:43Z) - A Dataset of Information-Seeking Questions and Answers Anchored in
Research Papers [66.11048565324468]
1,585の自然言語処理論文に関する5,049の質問のデータセットを提示する。
各質問は、対応する論文のタイトルと要約のみを読むNLP実践者によって書かれ、質問は全文に存在する情報を求めます。
他のQAタスクでうまく機能する既存のモデルは、これらの質問に答える上ではうまく機能せず、論文全体から回答する際には、少なくとも27 F1ポイントパフォーマンスが低下します。
論文 参考訳(メタデータ) (2021-05-07T00:12:34Z) - ComQA:Compositional Question Answering via Hierarchical Graph Neural
Networks [47.12013005600986]
我々は,120万以上の人間ラベル質問を含む大規模構成質問応答データセットを提案する。
ComQA問題に対処するために,低レベル語から高レベル語までの文書を表す階層型グラフニューラルネットワークを提案する。
提案モデルは,先行する機械読解法や事前学習法に比べて大幅に改善する。
論文 参考訳(メタデータ) (2021-01-16T08:23:27Z) - IIRC: A Dataset of Incomplete Information Reading Comprehension
Questions [53.3193258414806]
我々は、英語Wikipediaの段落に13K以上の質問があるIIRCというデータセットを提示する。
質問は、リンクされた文書にアクセスできなかった群衆労働者によって書かれた。
我々は、このデータセットのベースラインモデルを構築するために、様々な読解データセットに関する最近のモデリング作業に従う。
論文 参考訳(メタデータ) (2020-11-13T20:59:21Z) - Inquisitive Question Generation for High Level Text Comprehension [60.21497846332531]
InQUISITIVEは、文書を読みながら19K質問を抽出するデータセットである。
我々は,読者が情報を求めるための実践的な戦略に携わることを示す。
我々は, GPT-2に基づく質問生成モデルを評価し, 妥当な質問を生成することができることを示す。
論文 参考訳(メタデータ) (2020-10-04T19:03:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。