論文の概要: End-to-End QA on COVID-19: Domain Adaptation with Synthetic Training
- arxiv url: http://arxiv.org/abs/2012.01414v1
- Date: Wed, 2 Dec 2020 18:59:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-30 03:50:45.117273
- Title: End-to-End QA on COVID-19: Domain Adaptation with Synthetic Training
- Title(参考訳): 新型コロナウイルスに関するエンドツーエンドQA: ドメイン適応と総合トレーニング
- Authors: Revanth Gangi Reddy, Bhavani Iyer, Md Arafat Sultan, Rong Zhang, Avi
Sil, Vittorio Castelli, Radu Florian, Salim Roukos
- Abstract要約: エンドツーエンドの質問応答には、情報検索と機械読解の両方が必要である。
最近の研究は、オープンドメインデータセットからの教師付き質問応答(QA)例のみを使用して、ニューラルIRシステムのトレーニングに成功した。
われわれのニューラルIRとMRCシステムを組み合わせて、CORD-19コレクションのエンドツーエンドQAを大幅に改善した。
- 参考スコア(独自算出の注目度): 13.731352294133211
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: End-to-end question answering (QA) requires both information retrieval (IR)
over a large document collection and machine reading comprehension (MRC) on the
retrieved passages. Recent work has successfully trained neural IR systems
using only supervised question answering (QA) examples from open-domain
datasets. However, despite impressive performance on Wikipedia, neural IR lags
behind traditional term matching approaches such as BM25 in more specific and
specialized target domains such as COVID-19. Furthermore, given little or no
labeled data, effective adaptation of QA systems can also be challenging in
such target domains. In this work, we explore the application of synthetically
generated QA examples to improve performance on closed-domain retrieval and
MRC. We combine our neural IR and MRC systems and show significant improvements
in end-to-end QA on the CORD-19 collection over a state-of-the-art open-domain
QA baseline.
- Abstract(参考訳): QA (End-to-end Question answering) は、大量の文書コレクション上の情報検索 (IR) と、取得したパス上の機械読解 (MRC) の両方を必要とする。
最近の研究は、オープンドメインデータセットからの教師付き質問応答(QA)例のみを使用して、ニューラルIRシステムのトレーニングに成功した。
しかし、Wikipediaでの素晴らしいパフォーマンスにもかかわらず、BM25のような従来型の用語マッチングアプローチよりも、COVID-19のようなより具体的で特殊なターゲットドメインにおいて、ニューラルIRは遅れている。
さらに、ラベル付きデータがほとんどあるいは全くない場合、そのような対象領域においてQAシステムの効果的な適応も困難である。
そこで本研究では, 閉領域検索とMDCの性能向上のために, 合成合成QA例の適用について検討する。
我々は、我々のニューラルIRとMRCシステムを組み合わせて、最先端のオープンドメインQAベースラインよりもCORD-19コレクションのエンドツーエンドQAを大幅に改善した。
関連論文リスト
- Enhancing Retrieval in QA Systems with Derived Feature Association [0.0]
Retrieval augmented generation (RAG) は、長い文脈質問応答(QA)システムにおいて標準となっている。
我々は、AI派生文書(RAIDD)からレトリーバル(Retrieval)と呼ばれるRAGシステムへの新たな拡張を提案する。
論文 参考訳(メタデータ) (2024-10-02T05:24:49Z) - DEXTER: A Benchmark for open-domain Complex Question Answering using LLMs [3.24692739098077]
オープンドメイン複合質問回答 (QA) は証拠検索と推論において難しい課題である。
我々は、オープンドメイン設定で、最先端の訓練済み高密度・スパース検索モデルを評価する。
BM25のような遅延相互作用モデルや驚くほど語彙的モデルは、事前訓練された高密度検索モデルと比較してよく機能する。
論文 参考訳(メタデータ) (2024-06-24T22:09:50Z) - Building Interpretable and Reliable Open Information Retriever for New
Domains Overnight [67.03842581848299]
情報検索は、オープンドメイン質問応答(QA)など、多くのダウンストリームタスクにとって重要な要素である。
本稿では、エンティティ/イベントリンクモデルとクエリ分解モデルを用いて、クエリの異なる情報単位により正確にフォーカスする情報検索パイプラインを提案する。
より解釈可能で信頼性が高いが,提案したパイプラインは,5つのIRおよびQAベンチマークにおける通過カバレッジと記述精度を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-08-09T07:47:17Z) - Better Retrieval May Not Lead to Better Question Answering [59.1892787017522]
システムの性能を改善するための一般的なアプローチは、取得したコンテキストの品質をIRステージから改善することである。
マルチホップ推論を必要とするオープンドメインのQAデータセットであるStrategyQAでは、この一般的なアプローチは驚くほど非効率である。
論文 参考訳(メタデータ) (2022-05-07T16:59:38Z) - Synthetic Target Domain Supervision for Open Retrieval QA [24.48364368847857]
Dense Passage Retriever(DPR)を、新型コロナウイルス(COVID-19)などの閉鎖的かつ特殊なターゲットドメインでストレステストする。
DPRは、この重要な現実世界設定において、標準BM25より遅れている。
実験では、このうるさいが完全に自動化されたターゲットドメインの監視により、DPRはBM25よりも大きな利点がある。
論文 参考訳(メタデータ) (2022-04-20T06:28:13Z) - Retrieving and Reading: A Comprehensive Survey on Open-domain Question
Answering [62.88322725956294]
OpenQAの最近の研究動向を概観し、特にニューラルMSC技術を導入したシステムに注目した。
Retriever-Reader' と呼ばれる最新の OpenQA アーキテクチャを導入し、このアーキテクチャに従うさまざまなシステムを分析します。
次に、OpenQAシステムの開発における主要な課題について議論し、一般的に使用されるベンチマークの分析を提供する。
論文 参考訳(メタデータ) (2021-01-04T04:47:46Z) - Cross-Domain Generalization Through Memorization: A Study of Nearest
Neighbors in Neural Duplicate Question Detection [72.01292864036087]
重複質問検出(DQD)は,コミュニティの効率向上と自動質問応答システムの実現に重要である。
我々は、DQDのクロスドメイン一般化のために、ニューラル表現を活用し、近接する隣人を研究する。
StackExchange、Spring、Quoraの各データセットの異なるクロスドメインシナリオにおいて、このメソッドの堅牢なパフォーマンスを観察します。
論文 参考訳(メタデータ) (2020-11-22T19:19:33Z) - Self-Challenging Improves Cross-Domain Generalization [81.99554996975372]
畳み込みニューラルネットワーク(CNN)は、ラベルと相関する支配的特徴を活性化することにより、画像分類を行う。
ドメイン外データに対するCNNの一般化を著しく改善する簡単なトレーニングである自己整合表現(RSC)を導入する。
RSCはトレーニングデータ上で活性化される主要な機能に対して反復的に挑戦し、ラベルと相関する残りの機能を有効にするようネットワークに強制する。
論文 参考訳(メタデータ) (2020-07-05T21:42:26Z) - Dense Passage Retrieval for Open-Domain Question Answering [49.028342823838486]
本研究では,高密度表現のみを用いて検索を実践可能であることを示す。
我々の高密度レトリバーは、上位20経路の精度で9%-19%の絶対値で強力なルセンゼ-BM25システムより優れています。
論文 参考訳(メタデータ) (2020-04-10T04:53:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。