論文の概要: PRISM: Pareto-Efficient Retrieval over Intent-Aware Structured Memory for Long-Horizon Agents
- arxiv url: http://arxiv.org/abs/2605.12260v1
- Date: Tue, 12 May 2026 15:28:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.96247
- Title: PRISM: Pareto-Efficient Retrieval over Intent-Aware Structured Memory for Long-Horizon Agents
- Title(参考訳): PRISM:長距離エージェントの入射型構造記憶に対するパレート効率の高い検索
- Authors: Jingyi Peng, Zhongwei Wan, Weiting Liu, Qiuzhuang Sun,
- Abstract要約: ロングホライゾン言語エージェントは、どの固定されたコンテキストウィンドウよりもはるかに早く会話履歴を蓄積する。
PRISMは、長期記憶を共同検索・圧縮問題として扱う訓練不要な検索サイドフレームワークである。
- 参考スコア(独自算出の注目度): 9.504077408241544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-horizon language agents accumulate conversation history far faster than any fixed context window can hold, making memory management critical to both answer accuracy and serving cost. Existing approaches either expand the context window without addressing what is retrieved, perform heavy ingestion-time fact extraction at substantial token cost, or rely on heuristic graph traversal that leaves both accuracy and efficiency on the table. We present PRISM, a training-free retrieval-side framework that treats long-horizon memory as a joint retrieval-and-compression problem over a graph-structured memory. PRISM combines four orthogonal inference-time components: Hierarchical Bundle Search over typed relation paths, Query-Sensitive Edge Costing that aligns traversal with detected query intent, Evidence Compression that compresses the candidate bundle into a compact answer-side context, and Adaptive Intent Routing that routes most queries through zero-LLM tiers. By formulating retrieval as min-cost selection over typed path templates and pairing it with an LLM-side compression step, PRISM surfaces the right evidence under a strict context budget without any fine-tuning or modification to the upstream ingestion pipeline. Experiments on the LoCoMo benchmark show that PRISM delivers substantially higher LLM-judge accuracy than every same-protocol baseline at an order-of-magnitude smaller context budget, occupying a previously empty corner of the accuracy-context-cost frontier and demonstrating a superior balance between answer quality and retrieval efficiency.
- Abstract(参考訳): ロングホライゾン言語エージェントは、どの固定されたコンテキストウィンドウよりもはるかに早く会話履歴を蓄積する。
既存のアプローチでは、検索したものに対処することなくコンテキストウインドウを拡張するか、かなりのトークンコストで大量の摂取時の事実抽出を行うか、あるいはテーブルに精度と効率の両方を残したヒューリスティックグラフトラバーサルに依存する。
本稿では,長期記憶をグラフ構造メモリ上の共同検索圧縮問題として扱う,学習不要な検索サイドフレームワークであるPRISMを提案する。
PRISMは4つの直交的推論時コンポーネントを組み合わせる: 型付き関係パス上の階層的バンドル検索、検出されたクエリインテントとトラバーサルを整列するクエリ・センシティブエッジコスト、候補バンドルをコンパクトな応答側コンテキストに圧縮するエビデンス圧縮、ほとんどのクエリをゼロLLM層にルーティングするアダプティブインテントルーティング。
PRISMは、入力されたパステンプレートに対して最小のコスト選択として検索を定式化し、LSM側の圧縮ステップと組み合わせることで、上流の摂取パイプラインに微調整や修正を加えることなく、厳密なコンテキスト予算の下で正しいエビデンスを提示する。
LoCoMoベンチマークでの実験では、PRISMは最小限のコンテキスト予算で同じプロトコールベースラインよりもかなり高いLCM-judge精度を実現し、精度・コンテキスト・コスト・フロンティアの空きコーナーを占有し、回答品質と検索効率のバランスが良好であることを示している。
関連論文リスト
- Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction [127.64173950476702]
エージェントが直接、汎用端末ツールを用いて、生コーパスを直接検索する直接コーパス間相互作用(DCI)について検討する。
このアプローチではオフラインインデックスを必要とせず、ローカルコーパスの進化に自然に適応する。
IRベンチマークとエンドツーエンドのエージェント検索タスク全体にわたって、この単純なセットアップは、強いスパース、密度、リランクベースラインよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-05-03T19:13:11Z) - HingeMem: Boundary Guided Long-Term Memory with Query Adaptive Retrieval for Scalable Dialogues [12.529136884264092]
HingeMemは、バウンダリトリガーされたハイパーエッジを介して解釈可能なインデックスインターフェースを構築する、バウンダリガイダンス付き長期メモリである。
クエリ適応型検索機構は、(a) textit Whatを検索する: 要素インデックスメモリ上のクエリ条件付きルーティングを決定する。
HingeMemはクエリカテゴリの仕様なしで、強いベースラインに対して約20%の相対的な改善を実現している。
論文 参考訳(メタデータ) (2026-04-08T09:07:07Z) - Did You Check the Right Pocket? Cost-Sensitive Store Routing for Memory-Augmented Agents [0.0]
メモリ拡張されたエージェントは複数の特別なストアを保持するが、ほとんどのシステムはクエリ毎にすべてのストアから取得し、コストを増大させ、無関係なコンテキストを導入する。
本稿では,メモリの検索をストアルーティング問題として定式化し,カバレッジ,正確なマッチング,トークン効率の指標を用いて評価する。
論文 参考訳(メタデータ) (2026-03-08T09:12:30Z) - MemOCR: Layout-Aware Visual Memory for Efficient Long-Horizon Reasoning [36.52465672754168]
本稿では,コンテキスト予算の厳しい長期推論を改善するマルチモーダルメモリエージェントであるMemOCRを紹介する。
MemOCRは、視覚的レイアウトを通じて適応的な情報密度でメモリ空間を割り当てる。
我々は,多種多様な圧縮レベルにエージェントを露出する予算対応目標の下で,強化学習でMemOCRを訓練する。
論文 参考訳(メタデータ) (2026-01-29T09:47:17Z) - AMA: Adaptive Memory via Multi-Agent Collaboration [54.490349689939166]
複数の粒度にまたがるメモリ管理に協調エージェントを活用する新しいフレームワークであるAMA(Adaptive Memory via Multi-Agent Collaboration)を提案する。
AMAは、ステート・オブ・ザ・アートのベースラインを著しく上回り、トークンの消費をフルコンテキストの手法と比べて約80%削減する。
論文 参考訳(メタデータ) (2026-01-28T08:09:49Z) - SimpleMem: Efficient Lifelong Memory for LLM Agents [73.74399447715052]
セマンティックロスレス圧縮に基づく効率的なメモリフレームワークSimpleMemを紹介する。
本稿では,情報密度とトークン利用量の最大化を目的とした3段階パイプラインを提案する。
ベンチマークデータセットを用いた実験により,提案手法は精度,検索効率,推論コストにおいて,ベースラインアプローチを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2026-01-05T21:02:49Z) - MemSearcher: Training LLMs to Reason, Search and Manage Memory via End-to-End Reinforcement Learning [73.27233666920618]
本稿では,メモリを反復的に保持し,現在のターンと組み合わせたエージェントワークフローであるMemSearcherを提案する。
それぞれのターンで、MemSearcherはユーザーの質問をメモリに融合させ、推論トレースを生成し、検索アクションを実行し、メモリを更新してタスクの解決に必要な情報のみを保持する。
我々は,MemSearcher Agents の推論,検索戦略,メモリ管理を協調的に最適化する,エンドツーエンドの RL フレームワークである Multi-context GRPO を紹介する。
論文 参考訳(メタデータ) (2025-11-04T18:27:39Z) - Your Dense Retriever is Secretly an Expeditious Reasoner [12.123445960145693]
本稿では,ハイブリッドクエリ書き換えフレームワークであるAdaptive Query Reasoning (AdaQR)を提案する。
AdaQRは推論コストを28%削減し、保存または検索パフォーマンスを7%向上させる。
論文 参考訳(メタデータ) (2025-09-27T16:50:03Z) - ELITE: Embedding-Less retrieval with Iterative Text Exploration [5.8851517822935335]
大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。
長期のコンテキスト制約を維持する能力は、ドキュメントレベルやマルチターンタスクのパフォーマンスを制限します。
論文 参考訳(メタデータ) (2025-05-17T08:48:43Z) - Activation-aware Probe-Query: Effective Key-Value Retrieval for Long-Context LLMs Inference [56.71209737306054]
我々は,プローブ-textbfQuery を動的に決定し,関連する textbfKV ペアを推論するために利用する,トレーニングフリーの textbfActivation-aware アプローチである textbfActQKV を提案する。
Long-Bench と $infty$ Benchmarks の実験では、競合する推論品質とリソース効率を備えた最先端のパフォーマンスが実証されている。
論文 参考訳(メタデータ) (2025-02-19T08:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。