論文の概要: Dense Passage Retrieval for Open-Domain Question Answering
- arxiv url: http://arxiv.org/abs/2004.04906v3
- Date: Wed, 30 Sep 2020 21:27:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 20:54:14.349369
- Title: Dense Passage Retrieval for Open-Domain Question Answering
- Title(参考訳): オープンドメイン質問応答のためのDense Passage Retrieval
- Authors: Vladimir Karpukhin, Barlas O\u{g}uz, Sewon Min, Patrick Lewis, Ledell
Wu, Sergey Edunov, Danqi Chen, Wen-tau Yih
- Abstract要約: 本研究では,高密度表現のみを用いて検索を実践可能であることを示す。
我々の高密度レトリバーは、上位20経路の精度で9%-19%の絶対値で強力なルセンゼ-BM25システムより優れています。
- 参考スコア(独自算出の注目度): 49.028342823838486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-domain question answering relies on efficient passage retrieval to
select candidate contexts, where traditional sparse vector space models, such
as TF-IDF or BM25, are the de facto method. In this work, we show that
retrieval can be practically implemented using dense representations alone,
where embeddings are learned from a small number of questions and passages by a
simple dual-encoder framework. When evaluated on a wide range of open-domain QA
datasets, our dense retriever outperforms a strong Lucene-BM25 system largely
by 9%-19% absolute in terms of top-20 passage retrieval accuracy, and helps our
end-to-end QA system establish new state-of-the-art on multiple open-domain QA
benchmarks.
- Abstract(参考訳): オープンドメイン質問応答は、TF-IDFやBM25のような伝統的なスパースベクトル空間モデルがデファクト法であるような、選択された候補コンテキストに対する効率的な経路探索に依存する。
そこで本研究では,単純な二重エンコーダフレームワークを用いて,少数の質問やパスから埋め込みを学習し,高密度表現のみを用いて検索を実践可能であることを示す。
広い範囲のオープンドメインQAデータセットで評価すると、この高密度検索システムは、トップ20パスの取得精度において、9%-19%の絶対値で、強力なLucene-BM25システムより優れています。
関連論文リスト
- Open-domain Question Answering via Chain of Reasoning over Heterogeneous
Knowledge [82.5582220249183]
異種知識ソース間のシングル/マルチホップ質問に応答する新しいオープンドメイン質問応答(ODQA)フレームワークを提案する。
分離された証拠を収集するためにレトリバーにのみ依存する従来の方法とは異なり、我々の仲介者は検索された集合に対する推論の連鎖を実行する。
本システムは,2つのODQAデータセットであるOTT-QAとNQに対して,Wikipediaの表や節に対する競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-22T03:21:32Z) - End-to-End QA on COVID-19: Domain Adaptation with Synthetic Training [13.731352294133211]
エンドツーエンドの質問応答には、情報検索と機械読解の両方が必要である。
最近の研究は、オープンドメインデータセットからの教師付き質問応答(QA)例のみを使用して、ニューラルIRシステムのトレーニングに成功した。
われわれのニューラルIRとMRCシステムを組み合わせて、CORD-19コレクションのエンドツーエンドQAを大幅に改善した。
論文 参考訳(メタデータ) (2020-12-02T18:59:59Z) - Cross-Domain Generalization Through Memorization: A Study of Nearest
Neighbors in Neural Duplicate Question Detection [72.01292864036087]
重複質問検出(DQD)は,コミュニティの効率向上と自動質問応答システムの実現に重要である。
我々は、DQDのクロスドメイン一般化のために、ニューラル表現を活用し、近接する隣人を研究する。
StackExchange、Spring、Quoraの各データセットの異なるクロスドメインシナリオにおいて、このメソッドの堅牢なパフォーマンスを観察します。
論文 参考訳(メタデータ) (2020-11-22T19:19:33Z) - SPARTA: Efficient Open-Domain Question Answering via Sparse Transformer
Matching Retrieval [24.77260903221371]
SPARTAは,オープンドメイン質問応答の性能,一般化,解釈可能性を示す新しいニューラル検索手法である。
SPARTAはインバージョンインデックスとして効率的に実装可能なスパース表現を学習する。
我々は4つのオープンドメイン質問応答(OpenQA)タスクと11の検索質問応答(ReQA)タスクに対するアプローチを検証した。
論文 参考訳(メタデータ) (2020-09-28T02:11:02Z) - Answering Complex Open-Domain Questions with Multi-Hop Dense Retrieval [117.07047313964773]
複雑なオープンドメインの質問に答えるために, 単純で効率的なマルチホップ高密度検索手法を提案する。
本手法では,文書間ハイパーリンクやアノテートされたエンティティマーカーなど,コーパス固有の情報へのアクセスは不要である。
提案システムでは,HotpotQA上でのベストパブリッシュ精度と,推論時の10倍の速度で,より優れた効率・精度のトレードオフも実現している。
論文 参考訳(メタデータ) (2020-09-27T06:12:29Z) - Tradeoffs in Sentence Selection Techniques for Open-Domain Question
Answering [54.541952928070344]
文選択のためのモデルの2つのグループについて述べる。QAベースのアプローチは、解答候補を特定するための完全なQAシステムを実行し、検索ベースのモデルは、各質問に特に関連する各節の一部を見つける。
非常に軽量なQAモデルは、このタスクではうまく機能するが、検索ベースモデルは高速である。
論文 参考訳(メタデータ) (2020-09-18T23:39:15Z) - Answering Any-hop Open-domain Questions with Iterative Document
Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。
提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文 参考訳(メタデータ) (2020-09-16T04:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。