論文の概要: IslamicPCQA: A Dataset for Persian Multi-hop Complex Question Answering
in Islamic Text Resources
- arxiv url: http://arxiv.org/abs/2304.11664v1
- Date: Sun, 23 Apr 2023 14:20:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 17:13:42.921672
- Title: IslamicPCQA: A Dataset for Persian Multi-hop Complex Question Answering
in Islamic Text Resources
- Title(参考訳): ISPCQA: イスラムテキストリソースにおけるペルシアのマルチホップ複合質問のデータセット
- Authors: Arash Ghafouri, Hasan Naderi, Mohammad Aghajani asl and Mahdi
Firouzmandi
- Abstract要約: 本稿では,非構造化情報ソースに基づく複雑な質問に回答するためのISISPCQAデータセットを紹介する。
準備されたデータセットは、幅広いイスラムのトピックをカバーし、このテーマの中で複雑なペルシアの質問への答えを容易にすることを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Nowadays, one of the main challenges for Question Answering Systems is to
answer complex questions using various sources of information. Multi-hop
questions are a type of complex questions that require multi-step reasoning to
answer. In this article, the IslamicPCQA dataset is introduced. This is the
first Persian dataset for answering complex questions based on non-structured
information sources and consists of 12,282 question-answer pairs extracted from
9 Islamic encyclopedias. This dataset has been created inspired by the HotpotQA
English dataset approach, which was customized to suit the complexities of the
Persian language. Answering questions in this dataset requires more than one
paragraph and reasoning. The questions are not limited to any prior knowledge
base or ontology, and to provide robust reasoning ability, the dataset also
includes supporting facts and key sentences. The prepared dataset covers a wide
range of Islamic topics and aims to facilitate answering complex Persian
questions within this subject matter
- Abstract(参考訳): 現在、質問回答システムの主な課題の1つは、様々な情報源を使って複雑な質問に答えることである。
マルチホップ質問(Multi-hop question)は、多段階の推論を必要とする複雑な質問の一種である。
この記事では、ISISPCQAデータセットを紹介します。
これは非構造化情報ソースに基づく複雑な質問に答える最初のペルシャのデータセットであり、9つのイスラム百科事典から抽出された12,282の質問応答ペアで構成されている。
このデータセットは、ペルシャ語の複雑さに合わせてカスタマイズされたhotpotqa english datasetアプローチにインスパイアされたものだ。
このデータセットで質問に答えるには、複数の段落と推論が必要です。
質問は、事前の知識ベースやオントロジーに限らず、堅牢な推論能力を提供するため、データセットには、サポート事実とキー文も含まれている。
準備されたデータセットは、広範囲のイスラムトピックをカバーし、この問題における複雑なペルシアの質問に答えることを目的としている。
関連論文リスト
- PCoQA: Persian Conversational Question Answering Dataset [12.07607688189035]
PCoQAデータセットは、9,026のコンテキスト駆動質問を含む情報検索ダイアログを含むリソースである。
PCoQAは、以前の質問応答データセットと比較して、新しい課題を示すように設計されている。
本稿では,PCoQAデータセットを包括的に提示するだけでなく,各種ベンチマークモデルの性能も報告する。
論文 参考訳(メタデータ) (2023-12-07T15:29:34Z) - Answering Ambiguous Questions with a Database of Questions, Answers, and
Revisions [95.92276099234344]
ウィキペディアから生成される曖昧な質問のデータベースを利用して、あいまいな質問に答えるための新しい最先端技術を提案する。
提案手法は,リコール対策で15%,予測出力から不明瞭な質問を評価する尺度で10%向上する。
論文 参考訳(メタデータ) (2023-08-16T20:23:16Z) - PQuAD: A Persian Question Answering Dataset [0.0]
ペルシア語ウィキペディアの記事のクラウドソース読解データセット。
80,000の質問と回答があり、25%の質問は反対に答えられない。
最先端の事前学習言語モデルに対する実験では,74.8%のエクサクトマッチ (EM) と87.6%のF1スコアが得られた。
論文 参考訳(メタデータ) (2022-02-13T05:42:55Z) - Discourse Comprehension: A Question Answering Framework to Represent
Sentence Connections [35.005593397252746]
談話理解のためのモデルの構築と評価における重要な課題は、注釈付きデータの欠如である。
本稿では,ニュース文書の理解を目的としたスケーラブルなデータ収集を実現する新しいパラダイムを提案する。
得られたコーパスDCQAは、607の英語文書からなる22,430の質問応答ペアで構成されている。
論文 参考訳(メタデータ) (2021-11-01T04:50:26Z) - ConditionalQA: A Complex Reading Comprehension Dataset with Conditional
Answers [93.55268936974971]
条件付き回答を含む複雑な質問を含む質問回答データセットについて述べる。
このデータセットを ConditionalQA と呼びます。
本稿では,既存のQAモデルの多く,特に回答条件の選択において,ConditionalQAは困難であることを示す。
論文 参考訳(メタデータ) (2021-10-13T17:16:46Z) - A Knowledge-based Approach for Answering Complex Questions in Persian [0.0]
ペルシャ語における複雑な質問に答えるための知識に基づくアプローチを提案する。
対応可能な論理形式の集合を構築することで,多制約および多ホップ問題を扱う。
質問に対する答えは、知識グラフから抽出された論理形式への答えから作られる。
論文 参考訳(メタデータ) (2021-07-05T14:01:43Z) - PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge
Graph [0.0]
本稿では,ペルシャ語質問応答のためのデータセットである textitPeCoQ を紹介する。
このデータセットには、ペルシャの知識グラフであるFarsBaseから抽出された1万の複雑な質問と回答が含まれている。
データセットには、マルチリレーション、マルチエンタリティ、順序性、時間的制約など、さまざまな種類の複雑さがある。
論文 参考訳(メタデータ) (2021-06-27T08:21:23Z) - A Dataset of Information-Seeking Questions and Answers Anchored in
Research Papers [66.11048565324468]
1,585の自然言語処理論文に関する5,049の質問のデータセットを提示する。
各質問は、対応する論文のタイトルと要約のみを読むNLP実践者によって書かれ、質問は全文に存在する情報を求めます。
他のQAタスクでうまく機能する既存のモデルは、これらの質問に答える上ではうまく機能せず、論文全体から回答する際には、少なくとも27 F1ポイントパフォーマンスが低下します。
論文 参考訳(メタデータ) (2021-05-07T00:12:34Z) - MultiModalQA: Complex Question Answering over Text, Tables and Images [52.25399438133274]
テキスト,テーブル,画像に対する共同推論を必要とするデータセットであるMultiModalQAを提案する。
大規模で複雑なマルチモーダル質問を生成するための新しいフレームワークを使用してMMQAを作成します。
次に、単一のモダリティから回答できる質問を受け取り、それらを組み合わせてクロスモーダルな質問を生成する形式言語を定義します。
論文 参考訳(メタデータ) (2021-04-13T09:14:28Z) - IIRC: A Dataset of Incomplete Information Reading Comprehension
Questions [53.3193258414806]
我々は、英語Wikipediaの段落に13K以上の質問があるIIRCというデータセットを提示する。
質問は、リンクされた文書にアクセスできなかった群衆労働者によって書かれた。
我々は、このデータセットのベースラインモデルを構築するために、様々な読解データセットに関する最近のモデリング作業に従う。
論文 参考訳(メタデータ) (2020-11-13T20:59:21Z) - Inquisitive Question Generation for High Level Text Comprehension [60.21497846332531]
InQUISITIVEは、文書を読みながら19K質問を抽出するデータセットである。
我々は,読者が情報を求めるための実践的な戦略に携わることを示す。
我々は, GPT-2に基づく質問生成モデルを評価し, 妥当な質問を生成することができることを示す。
論文 参考訳(メタデータ) (2020-10-04T19:03:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。