論文の概要: UIT-ViCoV19QA: A Dataset for COVID-19 Community-based Question Answering
on Vietnamese Language
- arxiv url: http://arxiv.org/abs/2209.06668v1
- Date: Wed, 14 Sep 2022 14:24:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-15 13:21:58.776515
- Title: UIT-ViCoV19QA: A Dataset for COVID-19 Community-based Question Answering
on Vietnamese Language
- Title(参考訳): UIT-ViCoV19QA: ベトナム語に関するコミュニティベースの質問回答データセット
- Authors: Triet Minh Thai, Ngan Ha-Thao Chu, Anh Tuan Vo, Son T. Luu
- Abstract要約: UIT-ViCoV19QAと呼ばれる新型コロナウイルスの質問応答システムを開発するためのベトナム初のコミュニティベースの質問応答データセットを提示する。
このデータセットは、信頼できる医療ソースから収集された4,500の質問回答ペアで構成されており、少なくとも1つの回答と、質問毎に4つの独自のパラフレーズの回答がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: For the last two years, from 2020 to 2021, COVID-19 has broken disease
prevention measures in many countries, including Vietnam, and negatively
impacted various aspects of human life and the social community. Besides, the
misleading information in the community and fake news about the pandemic are
also serious situations. Therefore, we present the first Vietnamese
community-based question answering dataset for developing question answering
systems for COVID-19 called UIT-ViCoV19QA. The dataset comprises 4,500
question-answer pairs collected from trusted medical sources, with at least one
answer and at most four unique paraphrased answers per question. Along with the
dataset, we set up various deep learning models as baseline to assess the
quality of our dataset and initiate the benchmark results for further research
through commonly used metrics such as BLEU, METEOR, and ROUGE-L. We also
illustrate the positive effects of having multiple paraphrased answers
experimented on these models, especially on Transformer - a dominant
architecture in the field of study.
- Abstract(参考訳): 2020年から2021年までの2年間、新型コロナウイルスはベトナムを含む多くの国で疾病予防対策を破り、人命や社会社会の様々な側面に悪影響を及ぼしてきた。
また、地域社会の誤解を招く情報や、パンデミックに関するフェイクニュースも深刻な状況である。
そこで本研究では,ベトナム人コミュニティを基盤とした初の質問応答データセット uit-vicov19qa を提案する。
データセットは、信頼できる医療ソースから収集された4,500の質問応答ペアから成り、少なくとも1つの回答と、少なくとも1つの質問に4つの独特なパラフレーズ回答がある。
データセットとともに、データセットの品質を評価し、BLEU、METEOR、ROUGE-Lといった一般的なメトリクスを通じてさらなる研究を行うためのベンチマーク結果を開始するために、さまざまなディープラーニングモデルをベースラインとして設定しました。
また,これらのモデル,特に研究分野において支配的なアーキテクチャであるトランスフォーマ(transformer)に対して,複数のパラフラッシド回答を実験した結果,肯定的な効果を示す。
関連論文リスト
- Generative Pre-trained Transformer for Vietnamese Community-based
COVID-19 Question Answering [0.0]
GPT(Generative Pre-trained Transformer)は,SOTA(State-of-the-art)質問応答システムにおいて,デコーダとして有効に使用されている。
本稿では,ベトナムにおける新型コロナウイルス関連問合せに焦点を当てたコミュニティベースの質問応答のためのGPT-2の実装について述べる。
論文 参考訳(メタデータ) (2023-10-23T06:14:07Z) - SPBERTQA: A Two-Stage Question Answering System Based on Sentence
Transformers for Medical Texts [2.5199066832791535]
本稿では,MNR損失をBM25と組み合わせたSBERT(Sentence-BERT)に基づく2段階QAシステムを提案する。
その結果,従来の手法よりも優れた性能が得られた。
論文 参考訳(メタデータ) (2022-06-20T07:07:59Z) - COVID-19 Named Entity Recognition for Vietnamese [6.17059264011429]
ベトナムで最初の手作業によるcovid-19ドメイン固有データセットについて紹介する。
私たちのデータセットは、新たに定義されたエンティティタイプを持つ名前付きエンティティ認識タスクにアノテートされます。
当社のデータセットには、既存のベトナムのNERデータセットと比較して最大数のエンティティが含まれています。
論文 参考訳(メタデータ) (2021-04-08T16:35:34Z) - A Vietnamese Dataset for Evaluating Machine Reading Comprehension [2.7528170226206443]
ベトナム語として低リソース言語のための新しいデータセットであるUIT-ViQuADを提案する。
このデータセットは、ウィキペディアから174のベトナム語記事の5,109節に基づいて、23,000人以上の人が生成した質問応答ペアで構成されている。
UIT-ViQuADの最初の実験モデルとして、英語と中国語の最先端MRC手法の実験を行った。
論文 参考訳(メタデータ) (2020-09-30T15:06:56Z) - Understanding the temporal evolution of COVID-19 research through
machine learning and natural language processing [66.63200823918429]
重症急性呼吸器症候群2号(SARS-CoV-2)による新型コロナウイルス感染症(COVID-19)の流行は、世界中の人々の生活や社会に影響を与え続けている。
私たちは複数のデータソース、すなわちPubMedとArXivを使用し、現在のCOVID-19研究の風景を特徴づけるために、いくつかの機械学習モデルを構築しました。
調査の結果,PubMedとArXivで利用可能な研究の種類は異なることが確認された。
論文 参考訳(メタデータ) (2020-07-22T18:02:39Z) - A Qualitative Evaluation of Language Models on Automatic
Question-Answering for COVID-19 [4.676651062800037]
新型コロナウイルスは740万人以上の感染者と41万8000人以上の死者を出した。
オンラインコミュニティ、フォーラム、ソーシャルメディアは、関連する質問や回答を検索する潜在的な場所を提供する。
本稿では,新型コロナウイルスに関する質問に自動回答する言語モデルを適用し,生成した回答を質的に評価する。
論文 参考訳(メタデータ) (2020-06-19T05:13:57Z) - CO-Search: COVID-19 Information Retrieval with Semantic Search, Question
Answering, and Abstractive Summarization [53.67205506042232]
CO-Searchは、新型コロナウイルスの文献上の複雑なクエリを処理するように設計された、レトリバーランサーセマンティック検索エンジンである。
ドメイン固有の比較的限られたデータセットを考慮し、文書の段落と引用の2部グラフを生成する。
TREC-COVID情報検索課題のデータに基づいて,本システムの評価を行った。
論文 参考訳(メタデータ) (2020-06-17T01:32:48Z) - Cross-lingual Transfer Learning for COVID-19 Outbreak Alignment [90.12602012910465]
われわれは、Twitterを通じてイタリアの新型コロナウイルス感染症(COVID-19)の早期流行を訓練し、他のいくつかの国に移る。
実験の結果,クロスカントリー予測において最大0.85のスピアマン相関が得られた。
論文 参考訳(メタデータ) (2020-06-05T02:04:25Z) - What Are People Asking About COVID-19? A Question Classification Dataset [56.609360198598914]
13のソースから1,690件のCOVID-19に関する質問の集合であるCOVID-Qを提示する。
われわれのデータセットで最も一般的な質問は、COVID-19の感染、予防、社会的影響についてだった。
複数のソースに現れた多くの質問は、CDCやFDAのような信頼できる組織のFAQのウェブサイトでは答えられませんでした。
論文 参考訳(メタデータ) (2020-05-26T05:41:58Z) - Rapidly Bootstrapping a Question Answering Dataset for COVID-19 [88.86456834766288]
我々は、新型コロナウイルスに特化して設計された質問応答データセットの始まりであるCovidQAを紹介する。
これは、そのタイプの最初の公開リソースであり、より実質的な評価資源が利用可能になるまで研究を導くためのストップギャップとして意図されている。
論文 参考訳(メタデータ) (2020-04-23T17:35:11Z) - Mapping the Landscape of Artificial Intelligence Applications against
COVID-19 [59.30734371401316]
世界保健機関(WHO)は、SARS-CoV-2ウイルスによる新型コロナウイルスの感染をパンデミックと宣言した。
我々は、機械学習と、より広範に、人工知能を用いた最近の研究の概要を、新型コロナウイルス危機の多くの側面に取り組むために提示する。
論文 参考訳(メタデータ) (2020-03-25T12:30:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。