論文の概要: Conversational Machine Reading Comprehension for Vietnamese Healthcare
Texts
- arxiv url: http://arxiv.org/abs/2105.01542v2
- Date: Wed, 5 May 2021 01:48:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-06 13:02:07.737531
- Title: Conversational Machine Reading Comprehension for Vietnamese Healthcare
Texts
- Title(参考訳): ベトナムの医療用テキストの会話機械読解
- Authors: Son T. Luu, Mao Nguyen Bui, Loi Duc Nguyen, Khiem Vinh Tran, Kiet Van
Nguyen, Ngan Luu-Thuy Nguyen
- Abstract要約: 対話機械読解のためのベトナム語コーパス(UIT-ViCoQA)を提案する。
UIT-ViCoQAは1万の質問と2000以上の健康ニュース記事に関する回答からなる。
最良のモデルは45.27%のf1スコアを得るが、これは人間のパフォーマンスより30.91ポイント遅れている(76.18%)。
- 参考スコア(独自算出の注目度): 0.2446672595462589
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine reading comprehension (MRC) is a sub-field in natural language
processing or computational linguistics. MRC aims to help computers understand
unstructured texts and then answer questions related to them. In this paper, we
present a new Vietnamese corpus for conversational machine reading
comprehension (UIT-ViCoQA), consisting of 10,000 questions with answers over
2,000 conversations about health news articles. We analyze UIT-ViCoQA in depth
with different linguistic aspects. Then, we evaluate several baseline models
about dialogue and reading comprehension on the UIT-ViCoQA corpus. The best
model obtains an F1 score of 45.27%, which is 30.91 points behind human
performance (76.18%), indicating that there is ample room for improvement.
- Abstract(参考訳): machine reading comprehension (mrc) は自然言語処理や計算言語学におけるサブフィールドである。
MRCはコンピュータが構造化されていないテキストを理解し、それに関連する質問に答えることを目的としている。
本稿では,2000件以上の健康ニュース記事に関する質問に対する回答を1万件からなる対話機械読解のためのベトナム語コーパス(UIT-ViCoQA)を提案する。
UIT-ViCoQAを言語的側面によって詳細に分析する。
そして,UIT-ViCoQAコーパスを用いた対話と読み理解に関するベースラインモデルの評価を行った。
最良のモデルではF1スコアが45.27%であり、これは人間のパフォーマンス(76.18%)に30.91ポイント遅れている。
関連論文リスト
- How to Engage Your Readers? Generating Guiding Questions to Promote Active Reading [60.19226384241482]
教科書や科学論文から10Kのインテキスト質問のデータセットであるGuidingQを紹介した。
言語モデルを用いてこのような質問を生成するための様々なアプローチを探索する。
我々は、そのような質問が読解に与える影響を理解するために、人間の研究を行う。
論文 参考訳(メタデータ) (2024-07-19T13:42:56Z) - MTVQA: Benchmarking Multilingual Text-Centric Visual Question Answering [58.92057773071854]
MTVQAは、9つの異なる言語にまたがる高品質なヒューマンエキスパートアノテーションを特徴とする最初のベンチマークである。
MTVQAは9つの異なる言語にわたる高品質なヒューマンエキスパートアノテーションを特徴とする最初のベンチマークである。
論文 参考訳(メタデータ) (2024-05-20T12:35:01Z) - VlogQA: Task, Dataset, and Baseline Models for Vietnamese Spoken-Based Machine Reading Comprehension [1.3942150186842373]
本稿では,機械読解作業のためのベトナム語音声コーパスの開発過程について述べる。
ベトナムの既存のMRCコーポラは主にウィキペディアの記事、オンライン新聞、教科書などの公式文書に焦点を当てている。
対照的に、VlogQAはYouTubeからソースされた1,230の文書に基づいて10,076の質問応答ペアで構成されている。
論文 参考訳(メタデータ) (2024-02-05T00:54:40Z) - Can Language Models Learn to Listen? [96.01685069483025]
本稿では,話者の言葉に基づく社会的対話における聞き手から適切な表情応答を生成するための枠組みを提案する。
提案手法は,VQ-VAEを用いて定量化したリスナーの顔のジェスチャー列であるリスナーの応答を自己回帰的に予測する。
生成したリスナーの動きは,定量的メトリクスと質的ユーザスタディを通じて,言語意味論に精通し,反映していることを示す。
論文 参考訳(メタデータ) (2023-08-21T17:59:02Z) - A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.49218203204942]
我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。
我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文 参考訳(メタデータ) (2023-05-29T11:54:50Z) - A Multiple Choices Reading Comprehension Corpus for Vietnamese Language
Education [2.5199066832791535]
ViMMRC 2.0 はベトナムのテキストブックにおける多重選択読解作業のための以前の ViMMRC の拡張である。
このデータセットには、散文と詩からなる699の読解通路と、5,273の質問がある。
我々のマルチステージモデルは、テストセットの正確性によって58.81%を達成し、これは上位のBERTologyモデルよりも5.34%良い。
論文 参考訳(メタデータ) (2023-03-31T15:54:54Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - Sentence Extraction-Based Machine Reading Comprehension for Vietnamese [0.2446672595462589]
UIT-ViWikiQAは,ベトナム語における文抽出に基づく機械読解に関する最初のデータセットである。
このデータセットは、ウィキペディアから174のベトナム語記事の5.109節に基づく23.074の質問回答からなる。
我々の実験によると、最良のマシンモデルはXLM-R$_Largeであり、これは正確な一致(EM)スコアが85.97%、F1スコアが88.77%である。
論文 参考訳(メタデータ) (2021-05-19T10:22:27Z) - Towards Data Distillation for End-to-end Spoken Conversational Question
Answering [65.124088336738]
音声対話型質問応答タスク(SCQA)を提案する。
SCQAは,音声発話とテキストコーパスから複雑な対話の流れをモデル化することを目的としている。
我々の主な目的は、音声とテキストの両方で会話的な質問に対処するQAシステムを構築することである。
論文 参考訳(メタデータ) (2020-10-18T05:53:39Z) - An Experimental Study of Deep Neural Network Models for Vietnamese
Multiple-Choice Reading Comprehension [2.7528170226206443]
我々は、単語表現が機械読解に与える影響を理解するために、ニューラルネットワークに基づくモデルの実験を行う。
ベトナム語の単語埋め込みにおけるコマッチモデルと,複数字読解のためのBERTモデルについて検討した。
ViMMRCコーパスでは、BERTモデルの精度はテストセットで61.28%である。
論文 参考訳(メタデータ) (2020-08-20T07:29:14Z) - New Vietnamese Corpus for Machine Reading Comprehension of Health News
Articles [2.5199066832791535]
本稿では、ベトナム語のための新しいコーパスとしてViNewsQAを紹介し、医療読解モデルの評価を行う。
コーパスは、人為的な問合せ対22,057からなる。
実験の結果,ALBERTは65.26%,F1スコア84.89%の精度で一致した。
論文 参考訳(メタデータ) (2020-06-19T13:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。