論文の概要: HopRetriever: Retrieve Hops over Wikipedia to Answer Complex Questions
- arxiv url: http://arxiv.org/abs/2012.15534v1
- Date: Thu, 31 Dec 2020 10:36:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-18 01:11:33.200426
- Title: HopRetriever: Retrieve Hops over Wikipedia to Answer Complex Questions
- Title(参考訳): HopRetriever:ウィキペディアを検索して複雑な質問に答える
- Authors: Shaobo Li, Xiaoguang Li, Lifeng Shang, Xin Jiang, Qun Liu, Chengjie
Sun, Zhenzhou Ji, Bingquan Liu
- Abstract要約: We build HopRetriever that retrieves hops over Wikipedia to answer complex questions。
また,本手法は証拠収集過程の定量的解釈ももたらしている。
- 参考スコア(独自算出の注目度): 38.89150764309989
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collecting supporting evidence from large corpora of text (e.g., Wikipedia)
is of great challenge for open-domain Question Answering (QA). Especially, for
multi-hop open-domain QA, scattered evidence pieces are required to be gathered
together to support the answer extraction. In this paper, we propose a new
retrieval target, hop, to collect the hidden reasoning evidence from Wikipedia
for complex question answering. Specifically, the hop in this paper is defined
as the combination of a hyperlink and the corresponding outbound link document.
The hyperlink is encoded as the mention embedding which models the structured
knowledge of how the outbound link entity is mentioned in the textual context,
and the corresponding outbound link document is encoded as the document
embedding representing the unstructured knowledge within it. Accordingly, we
build HopRetriever which retrieves hops over Wikipedia to answer complex
questions. Experiments on the HotpotQA dataset demonstrate that HopRetriever
outperforms previously published evidence retrieval methods by large margins.
Moreover, our approach also yields quantifiable interpretations of the evidence
collection process.
- Abstract(参考訳): 大量のテキストコーパス(例えばWikipedia)から証拠を収集することは、オープンドメイン質問回答(QA)にとって大きな課題である。
特に、マルチホップオープンドメインQAでは、回答抽出を支援するために散在するエビデンスピースをまとめる必要がある。
本稿では,ウィキペディアから複雑な質問応答のための隠れた推論証拠を収集する新たな検索対象であるホップを提案する。
具体的には、この論文のホップはハイパーリンクと対応するアウトバウンドリンクドキュメントの組み合わせとして定義される。
ハイパーリンクは、テキストコンテキストにおけるアウトバウンドリンクエンティティの言及方法に関する構造化知識をモデル化した参照埋め込みとして符号化され、対応するアウトバウンドリンクドキュメントは、その内部の非構造化知識を表すドキュメント埋め込みとして符号化される。
そこで私たちは、ウィキペディア上のホップを検索して複雑な質問に答えるHopRetrieverを構築しました。
HotpotQAデータセットの実験は、HopRetrieverが以前公表した証拠検索方法よりも大きなマージンで優れていることを示した。
さらに,本手法は証拠収集過程の定量的解釈ももたらしている。
関連論文リスト
- HOLMES: Hyper-Relational Knowledge Graphs for Multi-hop Question Answering using LLMs [9.559336828884808]
大規模言語モデル(LLM)は、単純な(シングルホップ)質問に答えるには適しています。
質問の複雑さが増すにつれて、LLMの性能は低下する。
最近の手法では、構造化知識三重項を原文に組み込むことで、この負担を軽減しようとしている。
本稿では,知識グラフ(KG)を用いてコンテキスト認識し,クエリ関連情報を含むように蒸留する手法を提案する。
論文 参考訳(メタデータ) (2024-06-10T05:22:49Z) - Decomposing Complex Queries for Tip-of-the-tongue Retrieval [72.07449449115167]
複雑なクエリは、コンテンツ要素(例えば、書籍の文字やイベント)、ドキュメントテキスト以外の情報を記述する。
この検索設定は舌の先端 (TOT) と呼ばれ、クエリと文書テキスト間の語彙的および意味的重複に依存するモデルでは特に困難である。
クエリを個別のヒントに分解し、サブクエリとしてルーティングし、特定の検索者にルーティングし、結果をアンサンブルすることで、このような複雑なクエリを扱うための、シンプルで効果的なフレームワークを導入します。
論文 参考訳(メタデータ) (2023-05-24T11:43:40Z) - Open-domain Question Answering via Chain of Reasoning over Heterogeneous
Knowledge [82.5582220249183]
異種知識ソース間のシングル/マルチホップ質問に応答する新しいオープンドメイン質問応答(ODQA)フレームワークを提案する。
分離された証拠を収集するためにレトリバーにのみ依存する従来の方法とは異なり、我々の仲介者は検索された集合に対する推論の連鎖を実行する。
本システムは,2つのODQAデータセットであるOTT-QAとNQに対して,Wikipediaの表や節に対する競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-22T03:21:32Z) - Detect, Retrieve, Comprehend: A Flexible Framework for Zero-Shot
Document-Level Question Answering [6.224211330728391]
研究者は貴重な技術知識を含む何千もの学術文書を作成した。
文書レベルの質問応答(QA)は、人間の提案する質問を適応して多様な知識を抽出できる柔軟なフレームワークを提供する。
本稿では,PDFからテキストを抽出する3段階の文書QAアプローチ,抽出したテキストからエビデンスを抽出して適切な文脈を形成する方法,文脈から知識を抽出して高品質な回答を返すためのQAを提案する。
論文 参考訳(メタデータ) (2022-10-04T23:33:52Z) - End-to-End Multihop Retrieval for Compositional Question Answering over
Long Documents [93.55268936974971]
本稿では,長い文書の合成問題に答えるマルチホップ検索手法であるDocHopperを提案する。
各ステップでDocHopperは文書から段落や文を検索し、検索した結果とクエリを混合し、次のステップでクエリを更新する。
文書構造を活用すれば、長い文書の質問応答や検索性能を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2021-06-01T03:13:35Z) - Answering Complex Open-Domain Questions with Multi-Hop Dense Retrieval [117.07047313964773]
複雑なオープンドメインの質問に答えるために, 単純で効率的なマルチホップ高密度検索手法を提案する。
本手法では,文書間ハイパーリンクやアノテートされたエンティティマーカーなど,コーパス固有の情報へのアクセスは不要である。
提案システムでは,HotpotQA上でのベストパブリッシュ精度と,推論時の10倍の速度で,より優れた効率・精度のトレードオフも実現している。
論文 参考訳(メタデータ) (2020-09-27T06:12:29Z) - Answering Any-hop Open-domain Questions with Iterative Document
Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。
提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文 参考訳(メタデータ) (2020-09-16T04:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。