論文の概要: Revisiting the Open-Domain Question Answering Pipeline
- arxiv url: http://arxiv.org/abs/2009.00914v1
- Date: Wed, 2 Sep 2020 09:34:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 18:24:56.058904
- Title: Revisiting the Open-Domain Question Answering Pipeline
- Title(参考訳): オープンドメイン質問応答パイプラインの再検討
- Authors: Sina J. Semnani, Manish Pandey
- Abstract要約: 本稿では,新たなマルチステージパイプラインで構成されるオープンドメインQAシステムであるMindstoneについて述べる。
我々は,新しいパイプラインが低解像度ラベルの使用を可能にし,様々なタイミング要求を満たすように容易に調整できることを示す。
- 参考スコア(独自算出の注目度): 0.23204178451683266
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-domain question answering (QA) is the tasl of identifying answers to
natural questions from a large corpus of documents. The typical open-domain QA
system starts with information retrieval to select a subset of documents from
the corpus, which are then processed by a machine reader to select the answer
spans. This paper describes Mindstone, an open-domain QA system that consists
of a new multi-stage pipeline that employs a traditional BM25-based information
retriever, RM3-based neural relevance feedback, neural ranker, and a machine
reading comprehension stage. This paper establishes a new baseline for
end-to-end performance on question answering for Wikipedia/SQuAD dataset
(EM=58.1, F1=65.8), with substantial gains over the previous state of the art
(Yang et al., 2019b). We also show how the new pipeline enables the use of
low-resolution labels, and can be easily tuned to meet various timing
requirements.
- Abstract(参考訳): オープンドメイン質問応答(英: Open Domain Question answering, QA)とは、大量の文書から自然の質問に対する回答を識別する手法である。
典型的なオープンドメインQAシステムは、コーパスから文書のサブセットを選択する情報検索から始まり、マシンリーダーによって処理され、回答スパンを選択する。
本稿では、従来のBM25ベースの情報レトリバー、RM3ベースの神経関連フィードバック、ニューラルローダ、機械読解のステージを利用する新しいマルチステージパイプラインからなるオープンドメインQAシステムであるMindstoneについて述べる。
本稿では,Wikipedia/SQuADデータセット(EM=58.1, F1=65.8)に対する質問応答におけるエンドツーエンドのパフォーマンスの新たなベースラインを確立する。
また,新しいパイプラインによって低解像度ラベルの使用が可能となり,様々なタイミング要件を満たすように容易に調整できることを示す。
関連論文リスト
- Open-domain Question Answering via Chain of Reasoning over Heterogeneous
Knowledge [82.5582220249183]
異種知識ソース間のシングル/マルチホップ質問に応答する新しいオープンドメイン質問応答(ODQA)フレームワークを提案する。
分離された証拠を収集するためにレトリバーにのみ依存する従来の方法とは異なり、我々の仲介者は検索された集合に対する推論の連鎖を実行する。
本システムは,2つのODQAデータセットであるOTT-QAとNQに対して,Wikipediaの表や節に対する競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-22T03:21:32Z) - Generate rather than Retrieve: Large Language Models are Strong Context
Generators [74.87021992611672]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。
我々は,提案手法をgenRead (genRead) と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文 参考訳(メタデータ) (2022-09-21T01:30:59Z) - Zero-Shot Open-Book Question Answering [0.0]
本稿では,ドメイン固有のラベル付きデータ(ゼロショット)を持たない技術文書から自然言語質問に答えるソリューションを提案する。
私たちは、AWSのテクニカルドキュメントに関する実際の顧客からの質問に基づいて、オープンブックのQAのための新しいテストデータセットを導入しています。
ドメイン固有のトレーニングなしで、49%のF1と39%の正確なスコア(EM)をエンドツーエンドで達成できたのです。
論文 参考訳(メタデータ) (2021-11-22T20:38:41Z) - ComQA:Compositional Question Answering via Hierarchical Graph Neural
Networks [47.12013005600986]
我々は,120万以上の人間ラベル質問を含む大規模構成質問応答データセットを提案する。
ComQA問題に対処するために,低レベル語から高レベル語までの文書を表す階層型グラフニューラルネットワークを提案する。
提案モデルは,先行する機械読解法や事前学習法に比べて大幅に改善する。
論文 参考訳(メタデータ) (2021-01-16T08:23:27Z) - Retrieving and Reading: A Comprehensive Survey on Open-domain Question
Answering [62.88322725956294]
OpenQAの最近の研究動向を概観し、特にニューラルMSC技術を導入したシステムに注目した。
Retriever-Reader' と呼ばれる最新の OpenQA アーキテクチャを導入し、このアーキテクチャに従うさまざまなシステムを分析します。
次に、OpenQAシステムの開発における主要な課題について議論し、一般的に使用されるベンチマークの分析を提供する。
論文 参考訳(メタデータ) (2021-01-04T04:47:46Z) - Answering Open-Domain Questions of Varying Reasoning Steps from Text [39.48011017748654]
我々は,テキストのオープンドメイン質問から直接回答する統一システムを開発した。
我々は、必要なすべてのサブタスクを実行するために、単一のマルチタスクトランスモデルを用いる。
我々のモデルは既存のベンチマークとこの新しいベンチマークの両方で競合性能を示す。
論文 参考訳(メタデータ) (2020-10-23T16:51:09Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z) - Answering Any-hop Open-domain Questions with Iterative Document
Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。
提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文 参考訳(メタデータ) (2020-09-16T04:31:38Z) - Knowledge-Aided Open-Domain Question Answering [58.712857964048446]
本稿では,知識支援型オープンドメインQA(KAQA)手法を提案する。
文書検索の際、質問と他の文書との関係を考慮し、候補文書を採点する。
回答の再ランク付けの間、候補の回答は、自身のコンテキストだけでなく、他の文書からのヒントを使って再ランクされる。
論文 参考訳(メタデータ) (2020-06-09T13:28:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。