論文の概要: Integrating Chain-of-Thought into Generative Retrieval: A Preliminary Study
- arxiv url: http://arxiv.org/abs/2605.22358v1
- Date: Thu, 21 May 2026 11:48:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.237592
- Title: Integrating Chain-of-Thought into Generative Retrieval: A Preliminary Study
- Title(参考訳): チェーン・オブ・ワットを生成検索に統合する : 予備研究
- Authors: Wenhao Zhang, Ruihao Yu, Yi Bai, Zhumin Chen, Pengjie Ren,
- Abstract要約: ThinkGRは、チェーン・オブ・シークレットとドシド生成をインターリーブする統合フレームワークであり、単一の生成プロセス内で反復的な思考と検索を可能にする。
4つのマルチホップ検索ベンチマークの実験では、ThinkGRは最先端のパフォーマンスを平均で+6.86%向上した。
- 参考スコア(独自算出の注目度): 31.167867050243256
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While generative retrieval (GR) demonstrates competitive performance on standard retrieval benchmarks, existing approaches directly map queries to document identifiers (docids) without intermediate deliberation, limiting their effectiveness for complex queries that require multi-step reasoning. As a preliminary study on integrating chain-of-thought (CoT) into generative retrieval, we introduce ThinkGR, a unified framework that interleaves CoT with docid generation, enabling iterative thinking and retrieval within a single generative process. To bridge the gap between free-form thought generation and structured retrieval targets, we design (1) a hybrid decoding strategy that dynamically switches between unconstrained thought generation and constrained docid decoding, and (2) a two-phase training approach that first aligns thought-retrieval patterns through supervised fine-tuning, then optimizes thought quality via retrieval-grounded reinforcement learning. Experiments on four multi-hop retrieval benchmarks demonstrate that ThinkGR achieves state-of-the-art performance with an average improvement of +6.86\%. Our work opens new avenues for enhancing generative retrieval with explicit deliberation capabilities, with promising implications for retrieval tasks requiring complex reasoning.
- Abstract(参考訳): 生成検索(GR)は、標準的な検索ベンチマークで競合性能を示すが、既存のアプローチでは、中間的な検討なしに、クエリを直接ドキュメント識別子(ドシデント)にマッピングし、複数のステップの推論を必要とする複雑なクエリの有効性を制限する。
本研究では,CoTとドシド生成を融合した統合フレームワークであるThinkGRを導入し,一つの生成過程における反復的思考と検索を可能にする。
自由形態の思考生成と構造化された検索目標とのギャップを埋めるため,(1)制約のない思考生成と制約されたドシッド復号を動的に切り替えるハイブリッドデコーディング戦略,(2)教師付き微調整により思考検索パターンを最初に整列する2段階の学習手法を設計し,次いで検索基底強化学習により思考品質を最適化する。
4つのマルチホップ検索ベンチマークの実験により、ThinkGRは平均で+6.86\%の改善で最先端のパフォーマンスを達成した。
本研究は, 複雑な推論を必要とする検索タスクに有望な意味を持たせるために, 明示的な熟考能力を持つ生成的検索を向上するための新たな道を開く。
関連論文リスト
- CoSearch: Joint Training of Reasoning and Document Ranking via Reinforcement Learning for Agentic Search [51.911048955965136]
CoSearchは多段階推論エージェントと生成ドキュメントランキングモデルを共同でトレーニングするフレームワークである。
この結果から, 推論エージェントと検索システムの協調訓練は, 実現可能であり, 性能も高いことが示唆された。
論文 参考訳(メタデータ) (2026-04-19T17:48:17Z) - Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration [49.9937230730202]
本稿では,新たなアクター・リファイナ・コラボレーション・フレームワークであるSearch-R2を提案する。
提案手法は,生成過程をアクターに分解し,最初の推論軌道を生成する。
本稿では,検索-R2がモデルスケール全体にわたって強力なRAGとRLベースのベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-02-03T15:32:09Z) - RouteRAG: Efficient Retrieval-Augmented Generation from Text and Graph via Reinforcement Learning [69.87510139069218]
Retrieval-Augmented Generation (RAG)は、非パラメトリック知識をLarge Language Models (LLM)に統合する
強化学習(RL)による多ターン推論へのテキストベースRAGの進歩
LLMがマルチターンおよび適応的なグラフテキストハイブリッドRAGを実現するためのRLベースのフレームワークであるモデルを導入する。
論文 参考訳(メタデータ) (2025-12-10T10:05:31Z) - Chain-of-Retrieval Augmented Generation [91.02950964802454]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。