論文の概要: Retrieving and Reading: A Comprehensive Survey on Open-domain Question
Answering
- arxiv url: http://arxiv.org/abs/2101.00774v1
- Date: Mon, 4 Jan 2021 04:47:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 22:56:49.263813
- Title: Retrieving and Reading: A Comprehensive Survey on Open-domain Question
Answering
- Title(参考訳): 検索と読み: オープンドメイン質問応答に関する包括的調査
- Authors: Fengbin Zhu, Wenqiang Lei, Chao Wang, Jianming Zheng, Soujanya Poria,
Tat-Seng Chua
- Abstract要約: OpenQAの最近の研究動向を概観し、特にニューラルMSC技術を導入したシステムに注目した。
Retriever-Reader' と呼ばれる最新の OpenQA アーキテクチャを導入し、このアーキテクチャに従うさまざまなシステムを分析します。
次に、OpenQAシステムの開発における主要な課題について議論し、一般的に使用されるベンチマークの分析を提供する。
- 参考スコア(独自算出の注目度): 62.88322725956294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-domain Question Answering (OpenQA) is an important task in Natural
Language Processing (NLP), which aims to answer a question in the form of
natural language based on large-scale unstructured documents. Recently, there
has been a surge in the amount of research literature on OpenQA, particularly
on techniques that integrate with neural Machine Reading Comprehension (MRC).
While these research works have advanced performance to new heights on
benchmark datasets, they have been rarely covered in existing surveys on QA
systems. In this work, we review the latest research trends in OpenQA, with
particular attention to systems that incorporate neural MRC techniques.
Specifically, we begin with revisiting the origin and development of OpenQA
systems. We then introduce modern OpenQA architecture named
``Retriever-Reader'' and analyze the various systems that follow this
architecture as well as the specific techniques adopted in each of the
components. We then discuss key challenges to developing OpenQA systems and
offer an analysis of benchmarks that are commonly used. We hope our work would
enable researchers to be informed of the recent advancement and also the open
challenges in OpenQA research, so as to stimulate further progress in this
field.
- Abstract(参考訳): Open- Domain Question Answering (OpenQA) は、自然言語処理(NLP)において重要な課題であり、大規模非構造化文書に基づく自然言語形式での回答を目指している。
近年、特にneural machine reading comprehension(mrc)と統合される技術において、openqaに関する研究文献が急増している。
これらの研究は、ベンチマークデータセットの新たな高さまでパフォーマンスが向上しているが、QAシステムに関する既存の調査では、ほとんど取り上げられていない。
本稿では,神経mrc技術を組み込んだシステムに着目し,openqaの最新研究動向を概観する。
具体的には,OpenQAシステムの起源と開発の見直しから始める。
次に,‘retriever-reader’と呼ばれる現代的なopenqaアーキテクチャを紹介し,このアーキテクチャに従うさまざまなシステムと,各コンポーネントで採用されている特定の技術を分析します。
次に、OpenQAシステムの開発における主要な課題について議論し、一般的に使用されるベンチマークの分析を提供する。
我々の研究が、最近の進歩とOpenQA研究のオープンな課題を研究者に知らせ、この分野のさらなる進歩を促すことを願っている。
関連論文リスト
- Towards Better Generalization in Open-Domain Question Answering by Mitigating Context Memorization [67.92796510359595]
Open-Domain Question Answering (OpenQA)は、外部の大規模知識コーパスで事実質問に答えることを目的としている。
OpenQAモデルが完全に新しい知識ドメインにどの程度うまく移行できるかは、まだ不明である。
コーパス不変チューニング(CIT: Corpus-Invariant Tuning)は,記憶過剰な知識の軽減を目的とした,シンプルで効果的なトレーニング戦略である。
論文 参考訳(メタデータ) (2024-04-02T05:44:50Z) - Around the GLOBE: Numerical Aggregation Question-Answering on
Heterogeneous Genealogical Knowledge Graphs with Deep Neural Networks [0.934612743192798]
本稿では,系統樹の数値集約QAのための新しいエンドツーエンド手法を提案する。
提案されたアーキテクチャであるGLOBEは、このタスクの精度を87%向上させることで、最先端のモデルとパイプラインを上回っている。
本研究は系譜情報センターや博物館に実際的な意味を持つ可能性がある。
論文 参考訳(メタデータ) (2023-07-30T12:09:00Z) - PrimeQA: The Prime Repository for State-of-the-Art Multilingual Question
Answering Research and Development [24.022050096797606]
PRIMEQAは、QAの再調査を民主化し、最先端(SOTA)QAメソッドの複製を容易にすることを目的とした、ワンストップのQAレポジトリである。
検索や読解といったコアQA機能と,質問生成などの補助機能をサポートする。
フロントエンドアプリケーションの構築、pub-licベンチマーク上のSOTAメソッドの複製、既存のメソッドの拡張など、さまざまなユースケースのためのエンドツーエンドツールキットとして設計されている。
論文 参考訳(メタデータ) (2023-01-23T20:43:26Z) - XLMRQA: Open-Domain Question Answering on Vietnamese Wikipedia-based
Textual Knowledge Source [2.348805691644086]
本稿では,ウィキペディアベースのテキスト知識ソースに教師付きトランスフォーマーを用いたベトナム初のQAシステムであるXLMRQAを提案する。
3つのシステムで得られた結果から,質問タイプがQAシステムの性能に与える影響を解析した。
論文 参考訳(メタデータ) (2022-04-14T14:54:33Z) - Multifaceted Improvements for Conversational Open-Domain Question
Answering [54.913313912927045]
対話型オープンドメイン質問回答(MICQA)のための多面的改善フレームワークを提案する。
第一に、提案したKL分割に基づく正規化は、検索と解答のためのより良い質問理解をもたらすことができる。
第二に、追加されたポストランカモジュールは、より関連性の高いパスをトップにプッシュし、2アスペクトの制約で読者に選択できる。
第3に、十分に設計されたカリキュラム学習戦略は、訓練と推論の黄金の通路設定のギャップを効果的に狭め、黄金の通路支援なしで真の答えを見つけることを奨励する。
論文 参考訳(メタデータ) (2022-04-01T07:54:27Z) - OpenQA: Hybrid QA System Relying on Structured Knowledge Base as well as
Non-structured Data [15.585969737147892]
構造化KBと非構造化データに基づく知的質問応答システムOpenQAを提案する。
我々は、意味解析と深層表現学習に基づくKBQA構造化質問応答と、検索とニューラルマシン読解に基づく2段階非構造化質問応答をOpenQAに統合する。
論文 参考訳(メタデータ) (2021-12-31T09:15:39Z) - Open Domain Question Answering over Virtual Documents: A Unified
Approach for Data and Text [62.489652395307914]
我々は、知識集約型アプリケーションのための構造化知識を符号化する手段として、Data-to-text法、すなわち、オープンドメイン質問応答(QA)を用いる。
具体的には、ウィキペディアとウィキソースの3つのテーブルを付加知識源として使用する、データとテキスト上でのオープンドメインQAのための冗長化-レトリバー・リーダー・フレームワークを提案する。
UDT-QA(Unified Data and Text QA)は,知識インデックスの拡大を効果的に活用できることを示す。
論文 参考訳(メタデータ) (2021-10-16T00:11:21Z) - Narrative Question Answering with Cutting-Edge Open-Domain QA
Techniques: A Comprehensive Study [45.9120218818558]
我々は,NarrativeQAデータセットについて,最先端ODQA技術を用いた実験でベンチマークを行った。
このことは、書籍のQAがもたらす課題を定量化し、発行された最先端技術がルージュ-Lの絶対的な改善として$sim$7%で進歩する。
その結果,イベント中心の質問がこのタスクを支配しており,イベント指向シナリオを扱うための既存のQAモデルの欠如を実証していることがわかった。
論文 参考訳(メタデータ) (2021-06-07T17:46:09Z) - Conversational Question Answering: A Survey [18.447856993867788]
本調査は,会話質問回答(CQA)の最先端研究動向を包括的に概観する試みである。
この結果から,会話型AIの分野をさまざまな観点から活性化する一ターンから多ターンQAへの傾向が示唆された。
論文 参考訳(メタデータ) (2021-06-02T01:06:34Z) - A Survey on Complex Question Answering over Knowledge Base: Recent
Advances and Challenges [71.4531144086568]
知識ベース(KB)に対する質問回答(QA)は、自然言語の質問に自動的に答えることを目的としている。
研究者は、よりKBのトリプルと制約推論を必要とする単純な質問から複雑な質問へと注意を移した。
論文 参考訳(メタデータ) (2020-07-26T07:13:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。