論文の概要: End-to-End Beam Retrieval for Multi-Hop Question Answering
- arxiv url: http://arxiv.org/abs/2308.08973v2
- Date: Mon, 1 Apr 2024 08:30:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 13:22:09.679406
- Title: End-to-End Beam Retrieval for Multi-Hop Question Answering
- Title(参考訳): マルチホップ質問応答のためのエンド・ツー・エンドビーム検索
- Authors: Jiahao Zhang, Haiyang Zhang, Dongmei Zhang, Yong Liu, Shen Huang,
- Abstract要約: マルチホップ質問応答は、複数の関連するパスを見つけ出し、複雑な質問に答えるためにステップバイステップの推論を行う。
以前のレトリバーは2ホップの質問のためにカスタマイズされ、そのほとんどは異なるホップで個別に訓練された。
マルチホップQAのためのエンドツーエンドのビーム検索フレームワークであるビーム検索について紹介する。
- 参考スコア(独自算出の注目度): 37.13580394608824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-hop question answering (QA) involves finding multiple relevant passages and step-by-step reasoning to answer complex questions, indicating a retrieve-and-read paradigm. However, previous retrievers were customized for two-hop questions, and most of them were trained separately across different hops, resulting in a lack of supervision over the entire multi-hop retrieval process and leading to poor performance in complicated scenarios beyond two hops. In this work, we introduce Beam Retrieval, an end-to-end beam retrieval framework for multi-hop QA. This approach models the multi-hop retrieval process in an end-to-end manner by jointly optimizing an encoder and two classification heads across all hops. Moreover, Beam Retrieval maintains multiple partial hypotheses of relevant passages at each step, expanding the search space and reducing the risk of missing relevant passages. To establish a complete QA system, we incorporate a supervised reader or a large language model (LLM). Experimental results demonstrate that Beam Retrieval achieves a nearly 50% improvement compared with baselines on challenging MuSiQue-Ans, and it also surpasses all previous retrievers on HotpotQA and achieves 99.9% precision on 2WikiMultiHopQA. Providing high-quality context, Beam Retrieval helps our supervised reader achieve new state-of-the-art performance and substantially improves the few-shot QA performance of LLMs.
- Abstract(参考訳): マルチホップ質問応答(Multi-hop question answering, QA)は、複数の関連するパスを見つけ出し、複雑な質問に答えるためにステップバイステップの推論を行い、検索と読み取りのパラダイムを示す。
しかし、以前のリトリーバーは2ホップの質問のためにカスタマイズされ、そのほとんどは異なるホップで個別に訓練され、その結果、マルチホップの検索プロセス全体に対する監督が欠如し、2ホップを超えた複雑なシナリオでのパフォーマンスが低下した。
本稿では,マルチホップQAのためのエンドツーエンドのビーム検索フレームワークであるビーム検索について紹介する。
このアプローチは、エンコーダと2つの分類ヘッドを全てのホップに対して共同最適化することにより、エンドツーエンドでマルチホップ検索プロセスをモデル化する。
さらに、ビーム検索は、各ステップで関連する通路の複数の部分仮説を維持し、探索空間を拡大し、関連する経路の欠落のリスクを低減する。
完全QAシステムを構築するために,教師付きリーダや大規模言語モデル(LLM)を組み込んだ。
実験の結果、Beam Retrievalは挑戦するMuSiQue-Ansのベースラインに比べて50%近く改善され、2WikiMultiHopQAで99.9%の精度を達成した。
Beam Retrievalは高品質なコンテキストを提供することで、教師付きリーダが新しい最先端のパフォーマンスを実現し、LLMの少数ショットQAパフォーマンスを大幅に改善する。
関連論文リスト
- Retrieve, Summarize, Plan: Advancing Multi-hop Question Answering with an Iterative Approach [6.549143816134531]
二重機能要約器を備えたReSPと呼ばれる新しい反復RAG法を提案する。
マルチホップ質問応答HotpotQAと2WikiMultihopQAの実験結果から,本手法が最先端技術よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-07-18T02:19:00Z) - Performance Prediction for Multi-hop Questions [7.388002745070808]
オープンドメイン型マルチホップ質問の性能を予測するための検索前手法であるmultHPを提案する。
評価の結果,提案モデルが従来のシングルホップQPPモデルよりも優れた性能を示すことが示唆された。
論文 参考訳(メタデータ) (2023-08-12T01:34:41Z) - Rethinking Label Smoothing on Multi-hop Question Answering [87.68071401870283]
MHQA (Multi-Hop Question Answering) は質問応答において重要な分野である。
本研究では,マルチホップ推論の性能を制限する主要な要因を解析する。
学習プロセスに不確実性を組み込んだ新しいラベル平滑化手法F1 Smoothingを提案する。
論文 参考訳(メタデータ) (2022-12-19T14:48:08Z) - Locate Then Ask: Interpretable Stepwise Reasoning for Multi-hop Question
Answering [71.49131159045811]
マルチホップ推論では、複雑な質問に答えるために複数の文書を集約する必要がある。
既存の方法は通常、マルチホップの質問を単純なシングルホップの質問に分解する。
そこで本研究では,単一ホップ支援文識別と単一ホップ質問生成の両方を組み込む,解釈可能な段階的推論フレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-22T13:24:25Z) - From Easy to Hard: Two-stage Selector and Reader for Multi-hop Question
Answering [12.072618400000763]
マルチホップ質問応答(Multi-hop question answering, QA)は、複数の文書に対して複雑な推論を行うQAシステムを必要とする課題である。
本稿では,難読化情報を取り除き,文脈表現を改善するための新しいフレームワーク,From Easy to Hard (FE2H)を提案する。
FE2Hは文書セレクタとリーダーの両方を2段階に分割する。
論文 参考訳(メタデータ) (2022-05-24T02:33:58Z) - Modeling Multi-hop Question Answering as Single Sequence Prediction [88.72621430714985]
本稿では,単純な生成手法(PathFid)を提案する。
PathFidは、マルチホップ質問に対する回答を解決するための推論プロセスを明示的にモデル化する。
実験の結果,PathFidは2つのマルチホップQAデータセットに対して高い性能向上をもたらすことが示された。
論文 参考訳(メタデータ) (2022-05-18T21:57:59Z) - Decomposing Complex Questions Makes Multi-Hop QA Easier and More
Interpretable [25.676852169835833]
マルチホップQAでは、機械が複数の手がかりと推論を見つけることで複雑な質問に答える必要がある。
本稿では,複雑な質問分解に基づく3段階のフレームワークであるRelation Extractor-Reader and Comparator(RERC)を提案する。
2WikiMultiHopQAデータセットでは、我々のRERCモデルは最も高度なパフォーマンスを達成し、勝利した合同F1スコアはリーダーボード上で53.58である。
論文 参考訳(メタデータ) (2021-10-26T08:10:35Z) - Answering Complex Open-Domain Questions with Multi-Hop Dense Retrieval [117.07047313964773]
複雑なオープンドメインの質問に答えるために, 単純で効率的なマルチホップ高密度検索手法を提案する。
本手法では,文書間ハイパーリンクやアノテートされたエンティティマーカーなど,コーパス固有の情報へのアクセスは不要である。
提案システムでは,HotpotQA上でのベストパブリッシュ精度と,推論時の10倍の速度で,より優れた効率・精度のトレードオフも実現している。
論文 参考訳(メタデータ) (2020-09-27T06:12:29Z) - Answering Any-hop Open-domain Questions with Iterative Document
Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。
提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文 参考訳(メタデータ) (2020-09-16T04:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。