論文の概要: Structure Guided Retrieval-Augmented Generation for Factual Queries
- arxiv url: http://arxiv.org/abs/2604.22843v1
- Date: Tue, 21 Apr 2026 14:43:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:06.982387
- Title: Structure Guided Retrieval-Augmented Generation for Factual Queries
- Title(参考訳): ファクチュアルクエリのための構造ガイド付き検索型生成法
- Authors: Miao Xie, Xiao Zhang, Yi Li, Chunli Lv,
- Abstract要約: Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)における幻覚を軽減するために提案されている。
我々は、Exact Retrieval Problem (ERP)という新しい研究問題を導入する。
我々の知る限りでは、全てのクエリ条件を満たすためにRAGに構造情報を明示的に組み込んだ最初の問題定式化である。
我々は,20のドメインにまたがる複雑な条件を含む,120000の事実指向QAペアからなる大規模データセットであるExact Retrieval Question Answering (ERQA)を構築し,公開する。
- 参考スコア(独自算出の注目度): 6.076287232501258
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-Augmented Generation (RAG) has been proposed to mitigate hallucinations in large language models (LLMs), where generated outputs may be factually incorrect. However, existing RAG approaches predominantly rely on vector similarity for retrieval, which is prone to semantic noise and fails to ensure that generated responses fully satisfy the complex conditions specified by factual queries, often leading to incorrect answers. To address this challenge, we introduce a novel research problem, named Exact Retrieval Problem (ERP). To the best of our knowledge, this is the first problem formulation that explicitly incorporates structural information into RAG for factual questions to satisfy all query conditions. For this novel problem, we propose Structure Guided Retrieval-Augmented Generation (SG-RAG), which models the retrieval process as an embedding-based subgraph matching task, and uses the retrieved topological structures to guide the LLM to generate answers that meet all specified query conditions. To facilitate evaluation of ERP, we construct and publicly release Exact Retrieval Question Answering (ERQA), a large-scale dataset comprising 120000 fact-oriented QA pairs, each involving complex conditions, spanning 20 diverse domains. The experimental results demonstrate that SG-RAG significantly outperforms strong baselines on ERQA, delivering absolute improvements from 20.68 to 50.88 points across all evaluation metrics, while maintaining reasonable computational overhead.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)における幻覚を軽減するために提案されている。
しかし、既存のRAGアプローチは、主に検索のベクトル類似性に依存しており、これは意味的なノイズに起因し、生成した応答が事実クエリによって特定される複雑な条件を完全に満たすことを確実にすることができない。
この課題に対処するため,我々はExact Retrieval Problem (ERP) という新しい研究課題を紹介した。
我々の知る限りでは、全てのクエリ条件を満たすためにRAGに構造情報を明示的に組み込んだ最初の問題定式化である。
本稿では,検索プロセスを埋め込みベースのサブグラフマッチングタスクとしてモデル化し,検索したトポロジ構造を用いてLLMを誘導し,特定のクエリ条件をすべて満たす回答を生成する構造ガイド型検索拡張生成(SG-RAG)を提案する。
ERPの評価を容易にするために,我々は,20のドメインにまたがる複雑な条件を含む120000の事実指向QAペアからなる大規模データセットであるExact Retrieval Question Answering (ERQA)を構築し,公開する。
実験の結果、SG-RAGはERQAの強いベースラインを著しく上回り、全ての評価指標において20.68から50.88ポイントの絶対的な改善を達成し、計算オーバーヘッドを合理的に維持することを示した。
関連論文リスト
- Test-Time Strategies for More Efficient and Accurate Agentic RAG [58.44913384057518]
Retrieval-Augmented Generation (RAG) システムは複雑なマルチホップ問題に直面している。
このような手法は、以前に処理された情報の反復的な検索を含む非効率性を導入することができる。
本稿では,これらの問題を軽減するために,サーチ-R1パイプラインに対するテスト時間修正について検討する。
論文 参考訳(メタデータ) (2026-03-12T19:18:59Z) - Investigating the Robustness of Retrieval-Augmented Generation at the Query Level [4.3028340012580975]
推論中に外部知識を動的に組み込むソリューションとして、検索拡張生成(RAG)が提案されている。
その約束にもかかわらず、RAGシステムは実際的な課題に直面し、特に、正確な検索のために入力クエリの品質に強く依存する。
論文 参考訳(メタデータ) (2025-07-09T15:39:17Z) - Question Decomposition for Retrieval-Augmented Generation [2.6409776648054764]
本稿では疑問分解をサブクエストに組み込んだRAGパイプラインを提案する。
補間的な文書を効果的に組み立てる一方で、再ランク付けによってノイズが減少することを示す。
再ランク自体は標準的なものであるが、LLMによる質問分解と既製のクロスエンコーダのペアリングは、マルチホップ質問の検索ギャップを橋渡しすることを示す。
論文 参考訳(メタデータ) (2025-07-01T01:01:54Z) - ELOQ: Resources for Enhancing LLM Detection of Out-of-Scope Questions [52.33835101586687]
本研究では,検索した文書が意味的に類似しているように見えるスコープ外質問について検討するが,答えるために必要な情報がない。
本稿では,閉経後の文書から多様なスコープ外質問を自動的に生成するための,幻覚に基づくELOQを提案する。
論文 参考訳(メタデータ) (2024-10-18T16:11:29Z) - RQ-RAG: Learning to Refine Queries for Retrieval Augmented Generation [42.82192656794179]
大きな言語モデル(LLM)は優れた能力を示すが、不正確なあるいは幻覚反応を引き起こす傾向がある。
この制限は、膨大な事前トレーニングデータセットに依存することに起因するため、目に見えないシナリオでのエラーの影響を受けやすい。
Retrieval-Augmented Generation (RAG) は、外部の関連文書を応答生成プロセスに組み込むことによって、この問題に対処する。
論文 参考訳(メタデータ) (2024-03-31T08:58:54Z) - Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity [59.57065228857247]
Retrieval-augmented Large Language Models (LLMs) は、質問回答(QA)のようなタスクにおける応答精度を高めるための有望なアプローチとして登場した。
本稿では,クエリの複雑さに基づいて,LLMの最適戦略を動的に選択できる適応型QAフレームワークを提案する。
オープンドメインのQAデータセットを用いて、複数のクエリの複雑さを網羅し、QAシステムの全体的な効率性と精度を高めることを示す。
論文 参考訳(メタデータ) (2024-03-21T13:52:30Z) - CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models [49.16989035566899]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の能力を高める技術である。
本稿では,大規模かつ包括的なベンチマークを構築し,様々なRAGアプリケーションシナリオにおけるRAGシステムのすべてのコンポーネントを評価する。
論文 参考訳(メタデータ) (2024-01-30T14:25:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。