論文の概要: COVIDRead: A Large-scale Question Answering Dataset on COVID-19
- arxiv url: http://arxiv.org/abs/2110.09321v1
- Date: Tue, 5 Oct 2021 07:38:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-24 15:33:30.289844
- Title: COVIDRead: A Large-scale Question Answering Dataset on COVID-19
- Title(参考訳): covidread:covid-19に関するデータセットに答える大規模質問
- Authors: Tanik Saikh, Sovan Kumar Sahoo, Asif Ekbal, Pushpak Bhattacharyya
- Abstract要約: 非常に重要なリソースであるCOVIDReadは、SQuAD(Stanford Question Answering dataset)に似たデータセットで、100万以上の質問と回答のペアです。
これは、この非常に珍しい病気に関する一般大衆の問い合わせから、編集者や雑誌編集者による記事管理まで、多くの目的に役立てることができる貴重なリソースである。
いくつかのエンドツーエンドニューラルネットワークベースのベースラインモデルを構築し、最低F1が32.03%、最高F1が37.19%に達する。
- 参考スコア(独自算出の注目度): 41.23094507923245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: During this pandemic situation, extracting any relevant information related
to COVID-19 will be immensely beneficial to the community at large. In this
paper, we present a very important resource, COVIDRead, a Stanford Question
Answering Dataset (SQuAD) like dataset over more than 100k question-answer
pairs. The dataset consists of Context-Answer-Question triples. Primarily the
questions from the context are constructed in an automated way. After that, the
system-generated questions are manually checked by hu-mans annotators. This is
a precious resource that could serve many purposes, ranging from common people
queries regarding this very uncommon disease to managing articles by
editors/associate editors of a journal. We establish several end-to-end neural
network based baseline models that attain the lowest F1 of 32.03% and the
highest F1 of 37.19%. To the best of our knowledge, we are the first to provide
this kind of QA dataset in such a large volume on COVID-19. This dataset
creates a new avenue of carrying out research on COVID-19 by providing a
benchmark dataset and a baseline model.
- Abstract(参考訳): このパンデミックの状況では、新型コロナウイルスに関連する情報を抽出することは、コミュニティ全体にとって非常に有益である。
本稿では,SQuAD(Stanford Question Answering Dataset)と呼ばれる,100万以上の質問応答ペアのデータセットのような,非常に重要なリソースであるCOVIDReadを紹介する。
データセットはContext-Answer-Questionトリプルで構成される。
主に、コンテキストからの質問は自動化された方法で構築されます。
その後、システム生成の質問はhu-mans annotatorsによって手動でチェックされる。
これは、この非常に珍しい病気に関する一般の問い合わせから、雑誌の編集者/編集者による記事の管理まで、多くの目的に役立つ貴重なリソースです。
いくつかのエンドツーエンドニューラルネットワークベースのベースラインモデルを構築し、最低F1が32.03%、最高F1が37.19%に達する。
私たちの知る限りでは、新型コロナウイルス(COVID-19)でこのようなQAデータセットを大量に提供したのは、私たちが初めてです。
このデータセットは、ベンチマークデータセットとベースラインモデルを提供することで、COVID-19の研究を行う新たな方法を生成する。
関連論文リスト
- UNK-VQA: A Dataset and a Probe into the Abstention Ability of Multi-modal Large Models [55.22048505787125]
本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。
まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。
そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文 参考訳(メタデータ) (2023-10-17T02:38:09Z) - Encyclopedic VQA: Visual questions about detailed properties of
fine-grained categories [41.2406955639537]
Encyclopedic-VQAは大規模な視覚的質問応答データセットである。
それぞれが(最大5つの画像にマッチする221万のユニークな質問+回答のペアを含んでいる。
私たちのデータセットには、Wikipediaから派生した制御された知識ベースがあります。
論文 参考訳(メタデータ) (2023-06-15T16:03:01Z) - IIRC: A Dataset of Incomplete Information Reading Comprehension
Questions [53.3193258414806]
我々は、英語Wikipediaの段落に13K以上の質問があるIIRCというデータセットを提示する。
質問は、リンクされた文書にアクセスできなかった群衆労働者によって書かれた。
我々は、このデータセットのベースラインモデルを構築するために、様々な読解データセットに関する最近のモデリング作業に従う。
論文 参考訳(メタデータ) (2020-11-13T20:59:21Z) - ClarQ: A large-scale and diverse dataset for Clarification Question
Generation [67.1162903046619]
そこで我々は,スタックエクスチェンジから抽出したポストコメンデーションに基づいて,多様な,大規模な明確化質問データセットの作成を支援する,新しいブートストラップフレームワークを考案した。
質問応答の下流タスクに適用することで,新たに作成したデータセットの有用性を定量的に示す。
我々はこのデータセットを公開し、ダイアログと質問応答システムの拡張という大きな目標を掲げて、質問生成の分野の研究を促進する。
論文 参考訳(メタデータ) (2020-06-10T17:56:50Z) - What Are People Asking About COVID-19? A Question Classification Dataset [56.609360198598914]
13のソースから1,690件のCOVID-19に関する質問の集合であるCOVID-Qを提示する。
われわれのデータセットで最も一般的な質問は、COVID-19の感染、予防、社会的影響についてだった。
複数のソースに現れた多くの質問は、CDCやFDAのような信頼できる組織のFAQのウェブサイトでは答えられませんでした。
論文 参考訳(メタデータ) (2020-05-26T05:41:58Z) - Rapidly Bootstrapping a Question Answering Dataset for COVID-19 [88.86456834766288]
我々は、新型コロナウイルスに特化して設計された質問応答データセットの始まりであるCovidQAを紹介する。
これは、そのタイプの最初の公開リソースであり、より実質的な評価資源が利用可能になるまで研究を導くためのストップギャップとして意図されている。
論文 参考訳(メタデータ) (2020-04-23T17:35:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。