論文の概要: Understanding the Behaviors of Environment-aware Information Retrieval
- arxiv url: http://arxiv.org/abs/2606.16817v1
- Date: Mon, 15 Jun 2026 15:02:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.654063
- Title: Understanding the Behaviors of Environment-aware Information Retrieval
- Title(参考訳): 環境に配慮した情報検索の行動理解
- Authors: Ruifeng Yuan, Chaohao Yuan, David Dai, Yu Rong, Hong Cheng, Hou Pong Chan, Chenghao Xiao,
- Abstract要約: Retrieval-augmented Generation (RAG)アプローチは、複雑なクエリを扱う上で強力な能力を示している。
しかし、異なるレトリバーは、最適なパフォーマンスのために、根本的に異なるクエリ定式化戦略を必要とします。
- 参考スコア(独自算出の注目度): 27.277098026557997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent retrieval-augmented generation (RAG) approaches have demonstrated strong capability in handling complex queries, yet current research overlooks a critical challenge: different retrievers require fundamentally different query formulation strategies for optimal performance. In this work, we present the first systematic analysis of how LLMs can learn to adapt their query formulation strategies for different retrievers via reinforcement learning (RL). Our empirical study reveals that RL effectively teaches an LLM to tailor its queries to specific retriever characteristics. We discover that different retrievers exhibit surprisingly distinct optimal query styles (e.g., descriptive vs. question-like), suggesting strategies learned for one retriever ineffective for another. We further show that performance can be enhanced by incorporating retriever-specific human guidance and by scaling model size. To facilitate learning over multi-retrieval-step trajectories, we introduce a branching-based rollout technique that improves training stability. Our work provides the first empirical evidence and actionable insights for building truly retriever-aware RAG systems. Code and resources are available at https://github.com/LCO-Embedding/Envs-aware-Information-Retrieval.
- Abstract(参考訳): 近年のRAG(Research-augmented Generation)アプローチは、複雑なクエリを扱う上で強力な能力を示しているが、現在の研究は重要な課題を見落としている。
そこで本研究では,LLMが,RL (Regressed Learning) を用いて,異なる検索者に対してクエリ定式化戦略を適応させる方法について,初めて体系的な分析を行った。
実験により,RLはLLMを効果的に指導し,クエリを特定のレトリバー特性に合わせて調整することがわかった。
異なる検索者が驚くほど異なるクエリスタイル(例えば、記述型と質問型)を示し、ある検索者が他の検索に対して非効率に学習した戦略を提案する。
さらに、レトリバー固有の人的指導を取り入れ、モデルサイズを拡大することで、性能を向上させることができることを示す。
複数段階の軌道上での学習を容易にするため,訓練安定性を向上させる分岐型ロールアウト手法を提案する。
我々の研究は、真にレトリバーを意識したRAGシステムを構築するための、最初の実証的な証拠と実行可能な洞察を提供する。
コードとリソースはhttps://github.com/LCO-Embedding/Envs-aware-Information-Retrieval.comで入手できる。
関連論文リスト
- R$^3$AG: Retriever Routing for Retrieval-Augmented Generation [59.47703698994575]
R$3$AGは、検索機能を2つの学習可能なディメンション、すなわち検索品質と生成ユーティリティに分解する。
R$3$AGは、最高の個々のレトリバーと最先端の静的ルーティングメソッドの両方を一貫して上回っている。
論文 参考訳(メタデータ) (2026-04-22T06:51:20Z) - Reinforcement Fine-Tuning for History-Aware Dense Retriever in RAG [29.46121429194507]
Retrieval-augmented Generation (RAG) は、大規模言語モデルがエビデンスベースの応答を生成することを可能にする。
既存のソリューションは、レトリバー最適化とRAGパイプラインの目標との客観的なミスマッチに悩まされている。
論文 参考訳(メタデータ) (2026-02-03T15:30:14Z) - Multi-hop Reasoning via Early Knowledge Alignment [68.28168992785896]
アーリー・ナレッジ・アライメント(EKA)は、大規模言語モデルと文脈的に関連づけられた知識を整合させることを目的としている。
EKAは検索精度を大幅に改善し、カスケードエラーを低減し、性能と効率を向上する。
EKAは、大規模モデルにシームレスにスケールする、多目的でトレーニング不要な推論戦略として有効である。
論文 参考訳(メタデータ) (2025-12-23T08:14:44Z) - Harnessing the Power of Reinforcement Learning for Language-Model-Based Information Retriever via Query-Document Co-Augmentation [35.70731674603417]
LLM(Large Language Models)は、ユーザクエリとコーパスドキュメントの拡張に使用することができる。
ユーザクエリとコーパスドキュメントの両方を拡張できるLLMベースのレトリバーを提案する。
提案手法は,疎密な設定と密な設定の両方において,LLMに基づく検索性能を大幅に向上させる。
論文 参考訳(メタデータ) (2025-06-23T14:14:43Z) - LTRR: Learning To Rank Retrievers for LLMs [53.285436927963865]
ルーティングベースのRAGシステムは、単一リトリバーベースのシステムよりも優れていることを示す。
パフォーマンス向上は、特にAnswer Correctness(AC)メトリックでトレーニングされたモデルで顕著である。
SIGIR 2025 LiveRAG チャレンジの一環として,提案システムを用いて提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-06-16T17:53:18Z) - DACL-RAG: Data Augmentation Strategy with Curriculum Learning for Retrieval-Augmented Generation [54.26665681604041]
DACL-RAGは多段階データ拡張戦略と多段階学習パラダイムを組み合わせた多段階RAGトレーニングフレームワークである。
我々のフレームワークは、4つのオープンドメインQAデータセットで一貫した有効性を示し、複数の高度なメソッドに対して2%から4%のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-05-15T16:53:04Z) - R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning [87.30285670315334]
textbfR1-Searcherは、大規模言語モデルの検索能力を高めるために設計された、2段階の結果に基づく新しいRLアプローチである。
本フレームワークは, コールドスタート時に, プロセス報酬や蒸留を必要とせず, RLのみに依存している。
提案手法は, クローズドソースGPT-4o-miniと比較して, 従来の強力なRAG法よりも有意に優れていた。
論文 参考訳(メタデータ) (2025-03-07T17:14:44Z) - Fine-Grained Guidance for Retrievers: Leveraging LLMs' Feedback in Retrieval-Augmented Generation [20.420575358183687]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)に固有の幻覚を緩和する有効な方法であることが証明されている。
従来のアプローチでは、通常、RAGの最適化に欠けるセマンティックな類似性に基づいて、レトリバーをトレーニングする。
我々は,LLMの言語機能を活用して,より粒度の細かい情報中心の視点からサンプルを構築する新しいフレームワークFiGRetを提案する。
論文 参考訳(メタデータ) (2024-11-06T14:42:39Z) - Bridging the Preference Gap between Retrievers and LLMs [32.342245642909404]
大規模言語モデル(LLM)は、幅広いタスクにおいて優れた結果を示している。
Retrieval-augmented Generation (RAG) は、関連する情報を見つけることでパフォーマンスを向上させる効果的な方法である。
しかしながら、RAGにおけるレトリバーとLLMの関係はまだ解明されていない。
論文 参考訳(メタデータ) (2024-01-13T02:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。