論文の概要: End-to-End Multihop Retrieval for Compositional Question Answering over
Long Documents
- arxiv url: http://arxiv.org/abs/2106.00200v1
- Date: Tue, 1 Jun 2021 03:13:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-02 14:40:34.810177
- Title: End-to-End Multihop Retrieval for Compositional Question Answering over
Long Documents
- Title(参考訳): 長文合成質問応答のためのエンドツーエンドマルチホップ検索
- Authors: Haitian Sun, William W. Cohen, Ruslan Salakhutdinov
- Abstract要約: 本稿では,長い文書の合成問題に答えるマルチホップ検索手法であるDocHopperを提案する。
各ステップでDocHopperは文書から段落や文を検索し、検索した結果とクエリを混合し、次のステップでクエリを更新する。
文書構造を活用すれば、長い文書の質問応答や検索性能を大幅に改善できることを示す。
- 参考スコア(独自算出の注目度): 93.55268936974971
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Answering complex questions from long documents requires aggregating multiple
pieces of evidence and then predicting the answers. In this paper, we propose a
multi-hop retrieval method, DocHopper, to answer compositional questions over
long documents. At each step, DocHopper retrieves a paragraph or sentence
embedding from the document, mixes the retrieved result with the query, and
updates the query for the next step. In contrast to many other retrieval-based
methods (e.g., RAG or REALM) the query is not augmented with a token sequence:
instead, it is augmented by "numerically" combining it with another neural
representation. This means that model is end-to-end differentiable. We
demonstrate that utilizing document structure in this was can largely improve
question-answering and retrieval performance on long documents. We experimented
with DocHopper on three different QA tasks that require reading long documents
to answer compositional questions: discourse entailment reasoning, factual QA
with table and text, and information seeking QA from academic papers. DocHopper
outperforms all baseline models and achieves state-of-the-art results on all
datasets. Additionally, DocHopper is efficient at inference time, being 3~10
times faster than the baselines.
- Abstract(参考訳): 長い文書から複雑な質問に答えるには、複数の証拠をまとめて答えを予測する必要がある。
本稿では,長い文書に対して合成質問に答えるマルチホップ検索手法であるdochopperを提案する。
各ステップでDocHopperは文書から段落や文を検索し、検索した結果とクエリを混合し、次のステップでクエリを更新する。
他の多くの検索ベースメソッド(ragやrealmなど)とは対照的に、クエリはトークンシーケンスでは拡張されない。
これはモデルがエンドツーエンドで微分可能であることを意味する。
文書構造を活用すれば、長い文書の質問応答や検索性能を大幅に改善できることを示す。
我々はDocHopperを3つの異なるQAタスクで実験し、長い文書を読むことで構成的疑問に答える:談話内容推論、テーブルとテキストによる事実的QA、学術論文からのQAを求める情報。
DocHopperはすべてのベースラインモデルを上回っ、すべてのデータセットで最先端の結果を達成する。
さらに、DocHopperは推論時に効率的で、ベースラインの3~10倍高速である。
関連論文リスト
- DR-RAG: Applying Dynamic Document Relevance to Retrieval-Augmented Generation for Question-Answering [4.364937306005719]
RAGは最近、質問応答(QA)のような知識集約的なタスクにおいて、LLM(Large Language Models)のパフォーマンスを実証した。
重要な文書とクエリの間には関連性が低いものの,文書の一部とクエリを組み合わせることで,残りの文書を検索できることがわかった。
文書検索のリコールと回答の精度を向上させるために,DR-RAG(Dynamic-Relevant Retrieval-Augmented Generation)と呼ばれる2段階検索フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-11T15:15:33Z) - PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。
本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。
ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文 参考訳(メタデータ) (2023-09-16T04:29:05Z) - DAPR: A Benchmark on Document-Aware Passage Retrieval [57.45793782107218]
我々は,このタスクemphDocument-Aware Passage Retrieval (DAPR)を提案する。
State-of-The-Art(SoTA)パスレトリバーのエラーを分析しながら、大きなエラー(53.5%)は文書コンテキストの欠如に起因する。
提案するベンチマークにより,検索システムの開発・比較を今後行うことができる。
論文 参考訳(メタデータ) (2023-05-23T10:39:57Z) - CAPSTONE: Curriculum Sampling for Dense Retrieval with Document
Expansion [68.19934563919192]
本稿では,学習中に擬似クエリを利用して,生成したクエリと実際のクエリとの関係を徐々に向上させるカリキュラムサンプリング戦略を提案する。
ドメイン内およびドメイン外両方のデータセットに対する実験結果から,本手法が従来の高密度検索モデルより優れていることが示された。
論文 参考訳(メタデータ) (2022-12-18T15:57:46Z) - Answering Any-hop Open-domain Questions with Iterative Document
Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。
提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文 参考訳(メタデータ) (2020-09-16T04:31:38Z) - Knowledge-Aided Open-Domain Question Answering [58.712857964048446]
本稿では,知識支援型オープンドメインQA(KAQA)手法を提案する。
文書検索の際、質問と他の文書との関係を考慮し、候補文書を採点する。
回答の再ランク付けの間、候補の回答は、自身のコンテキストだけでなく、他の文書からのヒントを使って再ランクされる。
論文 参考訳(メタデータ) (2020-06-09T13:28:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。