論文の概要: Thinking Ahead: Prospection-Guided Retrieval of Memory with Language Models
- arxiv url: http://arxiv.org/abs/2605.14177v1
- Date: Wed, 13 May 2026 22:57:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.531309
- Title: Thinking Ahead: Prospection-Guided Retrieval of Memory with Language Models
- Title(参考訳): 考える - 言語モデルによる前方誘導型メモリ検索
- Authors: Harshita Chopra, Krishna Kant Chintalapudi, Suman Nath, Ryen W. White, Chirag Shah,
- Abstract要約: ロングホライゾンのパーソナライズには、対話履歴からユーザ固有の事実を検索する対話アシスタントが必要である。
実際には、多くの関連する事実は、密集した検索条件下でのクエリと意味的相似性が低いことが多い。
本稿では,記憶の保存方法から検索を分離するPGR(Prospection-Guided Retrieval)を提案する。
- 参考スコア(独自算出の注目度): 10.094292900770261
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long-horizon personalization requires dialogue assistants to retrieve user-specific facts from extended interaction histories. In practice, many relevant facts often have low semanticsimilarity to the query under dense retrieval. Standard Retrieval-Augmented Generation (RAG) and GraphRAG systems are still largely retrospective: they rely on embedding similarity to the query or on fixed graph traversals, so they often miss facts that matter for the user's needs but lie far from the query in embedding space. Inspired by prospection, the human ability to use imagined futures as cues for recall, we introduce Prospection-Guided Retrieval (PGR), which decouples retrieval from how memories are stored. Given a user query, PGR first expands the goal into a short Tree-of-Thought (ToT) or linear chain of plausible next steps, and uses these steps as retrieval probes rather than relying on the original query alone. The facts retrieved by these probes are then used to personalize the next round of prospection, enabling PGR to uncover additional memories that become relevant only after the simulation is grounded in the user's history. We also introduce MemoryQuest, a challenging multi-session benchmark in which each query is annotated with 3--5 dated reference facts subject to a low query-reference similarity constraint. Across 1,625 queries spanning 185 user profiles from 3 publicly available datasets, PGR-TOT substantially improves retrieval, including nearly 3x recall on MemoryQuest over the strongest baseline. In pairwise LLM-as-judge comparisons against baselines, PGR-generated responses are preferred on 89--98% of queries, with blinded human annotations on held-out subsets showing the same trend. Overall, the results demonstrate that explicit prospection yields large gains in long-horizon retrieval and response quality relative to similarity-only baselines.
- Abstract(参考訳): ロングホライゾンのパーソナライズには、対話履歴からユーザ固有の事実を検索する対話アシスタントが必要である。
実際には、多くの関連する事実は、密集した検索条件下でのクエリと意味的相似性が低いことが多い。
Standard Retrieval-Augmented Generation (RAG) と GraphRAG システムは依然として概ね振り返りであり、クエリや固定グラフのトラバーサルと類似点の埋め込みに依存しているため、ユーザのニーズに対して重要な事実を見逃しがちである。
記憶の保存方法から検索を分離するPGR(Prospection-Guided Retrieval)を導入する。
ユーザクエリが与えられた後、PGRはまず、目標を短いTree-of-Thought(ToT)または線形チェーンの次のステップに拡張し、元のクエリのみに頼るのではなく、これらのステップを検索プローブとして使用する。
これらのプローブによって取得された事実は、次の予想のラウンドをパーソナライズするために使用され、PGRは、シミュレーションがユーザーの履歴に埋もれた後にのみ関連性のある追加記憶を発見できる。
メモリクエスト(MemoryQuest)は、クエリと参照の類似性の制約が低い場合に、各クエリに3~5の日付の参照事実をアノテートする、挑戦的なマルチセッションベンチマークである。
3つの公開データセットから185のユーザプロファイルにまたがる1,625のクエリに対して、PGR-TOTは検索を大幅に改善している。
ベースラインに対するLLM-as-judgeの比較では,89~98%のクエリに対してPGRが生成する応答が好まれる。
以上の結果から, 類似性のみのベースラインに対して, 長い水平探索と応答品質において, 明らかな予測値が大きく向上することが示唆された。
関連論文リスト
- HaS: Accelerating RAG through Homology-Aware Speculative Retrieval [9.230969223605602]
知識データベースのサイズが大きくなるにつれて、検索は時間がかかります。
ホモロジーを意識した投機的検索フレームワークHaSを提案する。
HaSは、現実世界の人気パターン下でのクエリの頻度から恩恵を受け、かなりの効率向上を達成する。
論文 参考訳(メタデータ) (2026-04-22T11:15:54Z) - MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries [2.756584457554517]
Map-Disambiguate-Enrich-Reduce (MDER)はコンテキスト由来の3重記述を生成し、エンティティレベルの要約と統合する。
Decompose-Resolve (DR)は、ユーザクエリを解決可能なトリプルに分解し、知識グラフに格納する。
MDERとDRはLLM駆動のQAパイプラインを形成し、スパース、不完全、複雑なリレーショナルデータに対して堅牢である。
論文 参考訳(メタデータ) (2026-03-11T18:38:44Z) - Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval [59.295767860331004]
RF-Memは、親しみやすい不確実性誘導デュアルパスメモリレトリバーである。
それは、人間のようなデュアルプロセス認識をレトリバーに埋め込む。
一定の予算とレイテンシの制約の下で、ワンショット検索とフルコンテキスト推論を一貫して上回る。
論文 参考訳(メタデータ) (2026-03-10T06:31:44Z) - Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage [89.58253972744531]
Retrieval-augmented Generation (RAG) システムは、文書検索と生成モデルを組み合わせて、レポート生成のような複雑な情報を求める課題に対処する。
我々は,上流の検索指標が,最終生成応答の情報カバレッジの信頼性の高い早期指標として機能するかどうかを検討する。
本研究は,トピックとシステムレベルの両方で生成した応答におけるカバレッジベース検索指標とナゲットカバレッジとの間に強い相関関係を示した。
論文 参考訳(メタデータ) (2026-03-09T18:20:20Z) - FrugalRAG: Learning to retrieve and reason for multi-hop QA [10.193015391271535]
RAGメトリクスを改善するために大規模な微調整は必要ない。
監督されたRLベースの微調整は、粗悪さの観点からRAGに役立つ。
論文 参考訳(メタデータ) (2025-07-10T11:02:13Z) - Don't Do RAG: When Cache-Augmented Generation is All You Need for Knowledge Tasks [11.053340674721005]
検索拡張世代(RAG)は,外部知識ソースを統合することで言語モデルを強化する強力なアプローチとして注目されている。
本稿では、リアルタイム検索をバイパスする代替パラダイムであるキャッシュ拡張生成(CAG)を提案する。
論文 参考訳(メタデータ) (2024-12-20T06:58:32Z) - BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.54576644403115]
BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
私たちのデータセットは、経済学、心理学、数学、コーディングなど、さまざまな領域にまたがる1,384の現実世界のクエリで構成されています。
クエリに関する明示的な推論を取り入れることで、検索性能が最大12.2ポイント向上することを示す。
論文 参考訳(メタデータ) (2024-07-16T17:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。