論文の概要: QA-Expand: Multi-Question Answer Generation for Enhanced Query Expansion in Information Retrieval
- arxiv url: http://arxiv.org/abs/2502.08557v1
- Date: Wed, 12 Feb 2025 16:39:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-13 13:50:50.797143
- Title: QA-Expand: Multi-Question Answer Generation for Enhanced Query Expansion in Information Retrieval
- Title(参考訳): QA-Expand:情報検索におけるクエリ拡張のためのマルチクエストアンサー生成
- Authors: Wonduk Seo, Seunghyun Lee,
- Abstract要約: 本稿では,クエリ拡張のための新しい効果的なフレームワークであるQA-Expandを紹介する。
まず、最初のクエリから複数の関連する質問を生成し、その後、サロゲート文書として対応する疑似回答を生成する。
BEIR(英語版)やTREC(英語版)などのベンチマークの大規模な実験は、QA-Expandが最先端の手法よりも最大13%検索性能を向上させることを示した。
- 参考スコア(独自算出の注目度): 12.095687580827065
- License:
- Abstract: Query expansion is widely used in Information Retrieval (IR) to improve search outcomes by enriching queries with additional contextual information. Although recent Large Language Model (LLM) based methods generate pseudo-relevant content and expanded terms via multiple prompts, they often yield repetitive, narrow expansions that lack the diverse context needed to retrieve all relevant information. In this paper, we introduce QA-Expand, a novel and effective framework for query expansion. It first generates multiple relevant questions from the initial query and subsequently produces corresponding pseudo-answers as surrogate documents. A feedback model further rewrites and filters these answers to ensure only the most informative augmentations are incorporated. Extensive experiments on benchmarks such as BEIR and TREC demonstrate that QA-Expand enhances retrieval performance by up to 13% over state-of-the-art methods, offering a robust solution for modern retrieval challenges.
- Abstract(参考訳): クエリ拡張は、情報検索(IR)において、追加のコンテキスト情報によるクエリの強化によって検索結果を改善するために広く利用されている。
最近のLarge Language Model(LLM)ベースの手法は、疑似関連コンテンツを生成し、複数のプロンプトを介して拡張するが、全ての関連する情報を取得するのに必要な多様なコンテキストを欠いた反復的、狭い拡張をもたらすことが多い。
本稿では,クエリ拡張のための新しい効果的なフレームワークであるQA-Expandを紹介する。
まず、最初のクエリから複数の関連する質問を生成し、その後、サロゲート文書として対応する疑似回答を生成する。
フィードバックモデルは、これらの回答をさらに書き直し、フィルタリングして、最も情報に富んだ拡張が組み込まれることを保証する。
BEIR(英語版)やTREC(英語版)のようなベンチマークの広範な実験は、QA-Expandが最先端の手法よりも最大13%検索性能を高め、現代の検索課題に対する堅牢なソリューションを提供することを示した。
関連論文リスト
- Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent [102.31558123570437]
マルチモーダル大規模言語モデル(MLLM)に固有の「ハロシン化」問題を緩和する上で,mRAG(Multimodal Retrieval Augmented Generation)が重要な役割を果たしている。
マルチモーダル検索のための自己適応型計画エージェントOmniSearchを提案する。
論文 参考訳(メタデータ) (2024-11-05T09:27:21Z) - Retriever-and-Memory: Towards Adaptive Note-Enhanced Retrieval-Augmented Generation [72.70046559930555]
本稿では,複雑なQAタスクに対する適応ノート拡張RAG(Adaptive Note-Enhanced RAG)と呼ばれる汎用RAGアプローチを提案する。
具体的には、Adaptive-Noteは、知識の成長に関する包括的な視点を導入し、ノート形式で新しい情報を反復的に収集する。
さらに,適切な知識探索を促進するために,適応的な音符ベースの停止探索戦略を用いて,「何を検索し,いつ停止するか」を判断する。
論文 参考訳(メタデータ) (2024-10-11T14:03:29Z) - GenCRF: Generative Clustering and Reformulation Framework for Enhanced Intent-Driven Information Retrieval [20.807374287510623]
我々は,多種多様な意図を適応的に捉えるための生成クラスタリング・改革フレームワークGenCRFを提案する。
我々はGenCRFが,nDCG@10で従来のクエリ修正SOTAを最大12%上回り,最先端のパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2024-09-17T05:59:32Z) - Optimization of Retrieval-Augmented Generation Context with Outlier Detection [0.0]
そこで本研究では,質問応答システムに必要な文脈の小型化と品質向上に焦点をあてる。
私たちのゴールは、最も意味のあるドキュメントを選択し、捨てられたドキュメントをアウトリーチとして扱うことです。
その結果,質問や回答の複雑さを増大させることで,最大の改善が達成された。
論文 参考訳(メタデータ) (2024-07-01T15:53:29Z) - Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - Corpus-Steered Query Expansion with Large Language Models [35.64662397095323]
我々はCSQE(Corpus-Steered Query Expansion)を導入し,コーパス内に埋め込まれた知識の取り込みを促進する。
CSQEは、LLMの関連性評価機能を利用して、最初に検索された文書の重要文を体系的に同定する。
大規模な実験により、CSQEは訓練を必要とせず、特にLLMが知識を欠いているクエリで強い性能を示すことが明らかとなった。
論文 参考訳(メタデータ) (2024-02-28T03:58:58Z) - When do Generative Query and Document Expansions Fail? A Comprehensive
Study Across Methods, Retrievers, and Datasets [69.28733312110566]
LMに基づく拡張の最初の包括的解析を行う。
抽出器の性能と拡張による利得との間には強い負の相関関係があることが判明した。
より弱いモデルに拡張を使用するか、ターゲットデータセットがフォーマットのトレーニングコーパスと大きく異なる場合。
論文 参考訳(メタデータ) (2023-09-15T17:05:43Z) - End-to-end Knowledge Retrieval with Multi-modal Queries [50.01264794081951]
ReMuQは、テキストと画像のクエリからコンテンツを統合することで、大規模なコーパスから知識を取得するシステムを必要とする。
本稿では,入力テキストや画像を直接処理し,関連する知識をエンドツーエンドで検索する検索モデルReViz'を提案する。
ゼロショット設定下での2つのデータセットの検索において,優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-01T08:04:12Z) - Generate rather than Retrieve: Large Language Models are Strong Context
Generators [74.87021992611672]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。
我々は,提案手法をgenRead (genRead) と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文 参考訳(メタデータ) (2022-09-21T01:30:59Z) - Using Query Expansion in Manifold Ranking for Query-Oriented
Multi-Document Summarization [3.146785346730256]
本稿では,この問題を解くために,多様体ランキングに組み合わされたクエリ拡張手法を提案する。
本手法では,検索語自体と知識ベースであるWordNetの情報を同義語で拡張するだけでなく,文書自体の情報を様々な方法で拡張する。
さらに,単語の重複度と単語間の近接度を用いて文間の類似度を算出する。
論文 参考訳(メタデータ) (2021-07-31T02:20:44Z) - Answering Counting Queries over DL-Lite Ontologies [0.0]
本稿では,クエリをカウントする一般的な形式を導入し,従来の提案に関連付けるとともに,そのようなクエリに答えることの複雑さについて検討する。
我々は、複雑性境界の改善を確立させる、実践的に関連するいくつかの制約について検討する。
論文 参考訳(メタデータ) (2020-09-02T11:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。