論文の概要: XLMRQA: Open-Domain Question Answering on Vietnamese Wikipedia-based
Textual Knowledge Source
- arxiv url: http://arxiv.org/abs/2204.07002v1
- Date: Thu, 14 Apr 2022 14:54:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 13:00:43.494364
- Title: XLMRQA: Open-Domain Question Answering on Vietnamese Wikipedia-based
Textual Knowledge Source
- Title(参考訳): XLMRQA: ベトナム語ウィキペディアに基づくテキスト知識ソースに関するオープンドメイン質問応答
- Authors: Kiet Van Nguyen and Phong Nguyen-Thuan Do and Nhat Duy Nguyen and Tin
Van Huynh and Anh Gia-Tuan Nguyen and Ngan Luu-Thuy Nguyen
- Abstract要約: 本稿では,ウィキペディアベースのテキスト知識ソースに教師付きトランスフォーマーを用いたベトナム初のQAシステムであるXLMRQAを提案する。
3つのシステムで得られた結果から,質問タイプがQAシステムの性能に与える影響を解析した。
- 参考スコア(独自算出の注目度): 2.348805691644086
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Question answering (QA) is a natural language understanding task within the
fields of information retrieval and information extraction that has attracted
much attention from the computational linguistics and artificial intelligence
research community in recent years because of the strong development of machine
reading comprehension-based models. A reader-based QA system is a high-level
search engine that can find correct answers to queries or questions in
open-domain or domain-specific texts using machine reading comprehension (MRC)
techniques. The majority of advancements in data resources and machine-learning
approaches in the MRC and QA systems, on the other hand, especially in two
resource-rich languages such as English and Chinese. A low-resource language
like Vietnamese has witnessed a scarcity of research on QA systems. This paper
presents XLMRQA, the first Vietnamese QA system using a supervised
transformer-based reader on the Wikipedia-based textual knowledge source (using
the UIT-ViQuAD corpus), outperforming the two robust QA systems using deep
neural network models: DrQA and BERTserini with 24.46% and 6.28%, respectively.
From the results obtained on the three systems, we analyze the influence of
question types on the performance of the QA systems.
- Abstract(参考訳): 質問応答(QA)は情報検索と情報抽出の分野における自然言語理解の課題であり,機械読解モデルの開発が盛んに進んでいるため,近年,計算言語学や人工知能研究コミュニティから注目が集まっている。
リーダベースのQAシステムは、機械読解(MRC)技術を用いて、オープンドメインやドメイン固有のテキストでクエリや質問に対する正しい回答を見つけることができる高レベル検索エンジンである。
一方、MSCとQAシステムにおけるデータリソースと機械学習のアプローチの進歩の大部分は、特に英語と中国語のような2つのリソースに富む言語である。
ベトナムのような低リソースの言語は、QAシステムの研究が不足しているのを目撃している。
本稿では、ウィキペディアベースのテキスト知識ソース(UIT-ViQuADコーパスを使用)で教師付きトランスフォーマーベースのリーダーを用いたベトナム初のQAシステムであるXLMRQAについて、深層ニューラルネットワークモデルを用いた2つの堅牢QAシステム(DrQAとBERTseriniのそれぞれ24.46%と6.28%)をそれぞれ上回った。
3つのシステムで得られた結果から,質問タイプがQAシステムの性能に与える影響を解析した。
関連論文リスト
- EWEK-QA: Enhanced Web and Efficient Knowledge Graph Retrieval for Citation-based Question Answering Systems [103.91826112815384]
引用ベースのQAシステムは2つの欠点に悩まされている。
彼らは通常、抽出された知識の源としてWebにのみ依存し、外部の知識ソースを追加することで、システムの効率を損なう。
システムに供給された知識の内容を充実させるため,Web と 効率的な知識グラフ (KG) 検索ソリューション (EWEK-QA) を提案する。
論文 参考訳(メタデータ) (2024-06-14T19:40:38Z) - Building Efficient and Effective OpenQA Systems for Low-Resource Languages [17.64851283209797]
低コストで効率的な OpenQA システムを低リソース環境向けに開発できることを示す。
主な要素は、機械翻訳されたラベル付きデータセットと関連する非構造化知識ソースを用いた、弱い監視である。
我々は,SQuAD2.0の機械翻訳であるSQuAD-TRを提案する。
論文 参考訳(メタデータ) (2024-01-07T22:11:36Z) - Evaluating and Modeling Attribution for Cross-Lingual Question Answering [80.4807682093432]
この研究は、言語間質問応答の属性を初めて研究したものである。
我々は、5つの言語でデータを収集し、最先端の言語間QAシステムの属性レベルを評価する。
回答のかなりの部分は、検索されたどのパスにも帰属しないことがわかった。
論文 参考訳(メタデータ) (2023-05-23T17:57:46Z) - PIE-QG: Paraphrased Information Extraction for Unsupervised Question
Generation from Small Corpora [4.721845865189576]
PIE-QGは、オープン情報抽出(OpenIE)を使用して、パラフレーズ付き通路から合成トレーニング質問を生成する。
主語,述語,対象>の3つを各節から抽出し,主語(または対象)と述語で質問し,対象(または対象)を回答とする。
論文 参考訳(メタデータ) (2023-01-03T12:20:51Z) - Utilizing Background Knowledge for Robust Reasoning over Traffic
Situations [63.45021731775964]
我々は、インテリジェントトランスポーテーションの補完的な研究側面である交通理解に焦点を当てる。
本研究は,豊富なコモンセンス知識を前提として,テキストベースの手法とデータセットを対象とする。
交通状況に対するゼロショットQAには3つの知識駆動アプローチを採用しています。
論文 参考訳(メタデータ) (2022-12-04T09:17:24Z) - A Comparative Study of Question Answering over Knowledge Bases [2.6135123648293717]
知識ベースに対する質問応答 (KBQA) は,ユーザが知識ベースから情報を取り出すための一般的なアプローチとなっている。
8つのベンチマークデータセット上で6つの代表的なKBQAシステムの比較研究を行った。
本稿では,既存のモデルに優れた結果をもたらすための高度なマッピングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-15T14:23:47Z) - Learning to Answer Multilingual and Code-Mixed Questions [4.290420179006601]
質問応答(QA)は、人間とコンピュータのシームレスな相互作用において重要な要素である。
もっとも古い研究分野の1つであるにもかかわらず、現在のQAシステムは多言語クエリを扱う上で重要な課題に直面している。
この論文は、多言語環境でエンドユーザクエリを扱うためのQA技術の進歩に焦点を当てている。
論文 参考訳(メタデータ) (2022-11-14T16:49:58Z) - Asking for Knowledge: Training RL Agents to Query External Knowledge
Using Language [121.56329458876655]
グリッドワールドベースのQ-BabyAIとテキストベースのQ-TextWorldの2つの新しい環境を紹介した。
本稿では,意味のある知識を問うための言語コマンドを生成する「知識の探索(AFK)」エージェントを提案する。
論文 参考訳(メタデータ) (2022-05-12T14:20:31Z) - Improving Unsupervised Question Answering via Summarization-Informed
Question Generation [47.96911338198302]
質問生成 (QG) とは, 質問文, 質問文, 質問文, 質問文, 質問文, 質問文, 質問文, 質問文, 質問文, 質問文, 質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、質問文、
我々は、自由なニュース要約データを使用し、宣言文を依存性解析、名前付きエンティティ認識、セマンティックロールラベリングを用いて適切な質問に変換する。
得られた質問は、元のニュース記事と組み合わせて、エンドツーエンドのニューラルQGモデルをトレーニングする。
論文 参考訳(メタデータ) (2021-09-16T13:08:43Z) - Retrieving and Reading: A Comprehensive Survey on Open-domain Question
Answering [62.88322725956294]
OpenQAの最近の研究動向を概観し、特にニューラルMSC技術を導入したシステムに注目した。
Retriever-Reader' と呼ばれる最新の OpenQA アーキテクチャを導入し、このアーキテクチャに従うさまざまなシステムを分析します。
次に、OpenQAシステムの開発における主要な課題について議論し、一般的に使用されるベンチマークの分析を提供する。
論文 参考訳(メタデータ) (2021-01-04T04:47:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。