論文の概要: STRIDE: Strategic Iterative Decision-Making for Retrieval-Augmented Multi-Hop Question Answering
- arxiv url: http://arxiv.org/abs/2604.17405v1
- Date: Sun, 19 Apr 2026 12:19:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.508832
- Title: STRIDE: Strategic Iterative Decision-Making for Retrieval-Augmented Multi-Hop Question Answering
- Title(参考訳): STRIDE: 検索型マルチホップ質問回答のための戦略的反復的意思決定
- Authors: Wei Chen, Lili Zhao, Zhi Zheng, HuiJun Hou, Tong Xu,
- Abstract要約: マルチホップ質問応答 (MHQA) は、複数の文書にまたがる証拠を検索し、推論することで、複雑なクエリに対する正確な回答を可能にする。
既存のMHQAアプローチは主に、次の2つの大きな問題に苦しむ反復的な検索強化世代に依存している。
戦略計画,動的制御,接地型実行を分離するフレームワークSTRIDEを提案する。
- 参考スコア(独自算出の注目度): 9.69666629029613
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-hop question answering (MHQA) enables accurate answers to complex queries by retrieving and reasoning over evidence dispersed across multiple documents. Existing MHQA approaches mainly rely on iterative retrieval-augmented generation, which suffer from the following two major issues. 1) Existing methods prematurely commit to surface-level entities rather than underlying reasoning structures, making question decomposition highly vulnerable to lexical ambiguity. 2) Existing methods overlook the logical dependencies among reasoning steps, resulting in uncoordinated execution. To address these issues, we propose STRIDE, a framework that separates strategic planning, dynamic control, and grounded execution. At its core, a Meta-Planner first constructs an entity-agnostic reasoning skeleton to capture the abstract logic of the query, thereby deferring entity grounding until after the reasoning structure is established, which mitigates disambiguation errors caused by premature lexical commitment. A Supervisor then orchestrates sub-question execution in a dependency-aware manner, enabling efficient parallelization where possible and sequential coordination when necessary. By dynamically deciding whether to retrieve new evidence or infer from existing facts, it avoids redundant queries and error propagation, while fusing cross-branch information and reformulating failed queries to enhance robustness. Grounded fact extraction and logical inference are delegated to specialized execution modules, ensuring faithfulness through explicit separation of retrieval and reasoning. We further propose STRIDE-FT, a modular fine-tuning framework that uses self-generated execution trajectories from STRIDE, requiring neither human annotations nor stronger teacher models. Experiments show that STRIDE achieves robust and accurate reasoning, while STRIDE-FT effectively enhances open-source LLMs.
- Abstract(参考訳): マルチホップ質問応答 (MHQA) は、複数の文書にまたがる証拠を検索し、推論することで、複雑なクエリに対する正確な回答を可能にする。
既存のMHQAアプローチは主に、次の2つの大きな問題に苦しむ反復的な検索強化世代に依存している。
1) 既存の手法は, 基礎となる推論構造ではなく, 表面レベルの実体に早期にコミットし, 語彙的曖昧性に高い脆弱性を生じさせる。
2)既存のメソッドは推論ステップ間の論理的依存関係を見落とし、非協調的な実行をもたらす。
これらの問題に対処するため,戦略計画,動的制御,接地型実行を分離するフレームワークSTRIDEを提案する。
メタプランナーは、まず、エンティティに依存しない推論スケルトンを構築し、クエリの抽象論理をキャプチャし、推論構造が確立された後にエンティティ基底を遅延させ、初期語彙のコミットメントによる曖昧なエラーを緩和する。
スーパーバイザはサブクエストの実行を依存性を意識した方法でオーケストレーションし、可能な限り効率的な並列化と、必要に応じてシーケンシャルな調整を可能にする。
新たなエビデンスを検索するか、既存の事実から推測するかを動的に決定することで、クロスブランチ情報を融合させ、失敗したクエリを改定して堅牢性を高めるとともに、冗長なクエリやエラーの伝播を回避する。
基礎的な事実抽出と論理推論は、特定の実行モジュールに委譲され、検索と推論を明確に分離することで忠実性を確保する。
さらに,STRIDEから自己生成した実行軌跡を利用するモジュール型微調整フレームワークSTRIDE-FTを提案する。
実験の結果、STRIDEは堅牢で正確な推論を実現し、STRIDE-FTはオープンソースのLLMを効果的に強化することがわかった。
関連論文リスト
- The Unlearning Mirage: A Dynamic Framework for Evaluating LLM Unlearning [54.67958855362658]
複雑な構造化クエリを用いたアンラーニングテストを強調する動的フレームワークを提案する。
提案手法はまず,対象モデル(事前学習)から知識を抽出し,単純なクエリからマルチホップチェーンまで,対象プローブを構築する。
本フレームワークは,テストセットを手作業で構築することなく,非学習手法の実用的でスケーラブルな評価を可能にする。
論文 参考訳(メタデータ) (2026-03-11T19:51:33Z) - ROG: Retrieval-Augmented LLM Reasoning for Complex First-Order Queries over Knowledge Graphs [14.25887925588904]
本稿では,クエリを意識した近傍検索と大規模言語モデル(LLM)の連鎖推論を組み合わせた検索拡張フレームワークを提案する。
ROGはマルチ演算クエリを単一演算サブクエリのシーケンスに分解する。
中間回答セットはステップ間でキャッシュされ再利用され、深い推論チェーンの一貫性が向上します。
論文 参考訳(メタデータ) (2026-02-02T17:45:43Z) - CoT-Seg: Rethinking Segmentation with Chain-of-Thought Reasoning and Self-Correction [50.67483317563736]
本稿では,段階的に考察し,必要な情報を検索し,結果を生成し,自己評価を行い,結果を洗練するシステムを提案する。
CoT-Segは、思考の連鎖推論と自己補正を組み合わせることで、推論セグメンテーションを再考する、トレーニング不要のフレームワークである。
論文 参考訳(メタデータ) (2026-01-24T11:41:54Z) - CoG: Controllable Graph Reasoning via Relational Blueprints and Failure-Aware Refinement over Knowledge Graphs [53.199517625701475]
CoGはDual-Process Theoryにインスパイアされたトレーニング不要のフレームワークで、直観と熟考の相互作用を模倣している。
CoGは精度と効率の両方において最先端のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2026-01-16T07:27:40Z) - Query, Decompose, Compress: Structured Query Expansion for Efficient Multi-Hop Retrieval [19.37201042661162]
大規模言語モデル(LLM)は、クエリ拡張にますます採用されている。
DeCoR(Decompose and Compress for Retrieval)は構造化情報処理を基盤としたフレームワークである。
論文 参考訳(メタデータ) (2026-01-14T05:55:49Z) - PRISMA: Reinforcement Learning Guided Two-Stage Policy Optimization in Multi-Agent Architecture for Open-Domain Multi-Hop Question Answering [26.994531058178982]
大規模コーパスに対する現実世界のオープンドメイン問題への回答は、レトリーバル・拡張ジェネレーション(RAG)システムにおいて重要な課題である。
近年の研究では、検索強化推論プロセスのエンドツーエンド最適化に強化学習(RL)を採用している。
PRISMAはPlan-Retrieve-Inspect-Memoizeアーキテクチャを特徴とする分離誘導型フレームワークである。
論文 参考訳(メタデータ) (2026-01-09T01:38:38Z) - KBQA-R1: Reinforcing Large Language Models for Knowledge Base Question Answering [64.62317305868264]
テキスト模倣から強化学習によるインタラクション最適化へパラダイムをシフトするフレームワークである textbfKBQA-R1 を提案する。
KBQAを多ターン決定プロセスとして扱うことで,行動のリストを用いて知識ベースをナビゲートすることを学ぶ。
WebQSP、GrailQA、GraphQuestionsの実験では、KBQA-R1が最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-10T17:45:42Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - OPERA: A Reinforcement Learning--Enhanced Orchestrated Planner-Executor Architecture for Reasoning-Oriented Multi-Hop Retrieval [23.400253066454]
Orchestrated Planner-Executor Reasoning Architecture (OPERA)は、推論駆動型検索フレームワークである。
OPERAは質問をサブゴールに分解し、Reason-Execute Module (REM) によって実行され、正確な推論と効果的な検索のための特別なコンポーネントを持つ。
論文 参考訳(メタデータ) (2025-08-22T14:50:26Z) - LAG: Logic-Augmented Generation from a Cartesian Perspective [7.2022636966543745]
本稿では,体系的な問題分解と依存性を考慮した推論を通じて知識強化を再構築する新しいパラダイムである論理拡張生成(LAG)を紹介する。
4つのベンチマークデータセットの実験では、LAGは推論の堅牢性を大幅に向上し、幻覚を減少させ、LLM問題の解決を人間の認知と整合させることが示されている。
論文 参考訳(メタデータ) (2025-08-07T15:42:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。