論文の概要: EMBER: Efficient Memory via Budgeted Evidence Retention for Long-Horizon Agents
- arxiv url: http://arxiv.org/abs/2606.05894v1
- Date: Thu, 04 Jun 2026 09:03:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.673417
- Title: EMBER: Efficient Memory via Budgeted Evidence Retention for Long-Horizon Agents
- Title(参考訳): EMBER:長期薬剤の予算的証拠保持による効率的な記憶
- Authors: Yilong Li, Suman Banerjee, Tong Che,
- Abstract要約: ロングホライゾンエージェントは大きな履歴をアーカイブすることができるが、将来の回答は依然として検索、再読み込み、コンテキストコストがかかる。
EMBERは、コンパクトでソース支援型エビデンス状態を構築する学習的保持ポリシーである。
LongMemEval-RRでは,LongMemEval由来の残留証拠プロトコルEMBER-14Bが8192token残留証拠比較点で0.3017F1に達する。
- 参考スコア(独自算出の注目度): 8.638696735781478
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-horizon agents can archive large histories, but future answers still incur retrieval, rereading, and context costs. When retained memory misses answer-relevant evidence, the system must return to larger portions of the raw history. We study budgeted evidence survival: before the query is known, which source evidence should be retained so that it remains recoverable and usable under a fixed retained source-evidence token budget? We instantiate this setting as Budgeted Pre-Query Retention, where memory is written during ingestion and later read without access to the full raw stream. We introduce EMBER, a learned retention policy that constructs a compact, source-backed evidence state. EMBER stores evidence capsules: verbatim source excerpts paired with retrieval keys and update metadata, preserving both grounding and read-time access. Post-query outcome feedback trains the writer to preserve evidence across the ingestion-retrieval-answer chain. On LongMemEval-RR, our LongMemEval-derived retained-evidence protocol, EMBER-14B reaches 0.3017 F1 at the 8192-token retained-evidence comparison point, compared with 0.1765 for the strongest non-EMBER budgeted baseline. Across retained source-evidence budgets, EMBER improves F1, Retain-Recall, and Read-Recall, indicating that long-horizon memory depends on retaining evidence within the budget rather than rereading larger histories.
- Abstract(参考訳): ロングホライゾンエージェントは大きな履歴をアーカイブすることができるが、将来の回答は依然として検索、再読み込み、コンテキストコストがかかる。
記憶の保持が答えに関連する証拠を見逃す場合、システムは生の履歴のより大きな部分に戻らなければならない。
クェリが判明する前に、どの情報源の証拠を保持すべきで、固定されたソース・エビデンストークンの予算の下で、回復可能で使用可能なままにしておくべきかを調査する。
私たちはこの設定をBudgeted Pre-Query Retentionとしてインスタンス化します。
EMBERは、コンパクトでソース支援型エビデンス状態を構築する学習的保持ポリシーである。
EMBERはエビデンスカプセルを格納する: verbatim source excerpts with retrieve key and update metadata,serving and read-time access。
ポストクェリの結果のフィードバックは、著者に、摂取-検索-回答の連鎖にまたがる証拠を保存するよう訓練する。
LongMemEval-RRでは,最強の非EMBER予算ベースラインでは0.1765に対して,EMBER-14Bは8192token保持エビデンス比較ポイントで0.3017F1に達した。
F1、Retain-Recall、Read-Recallを改良し、長い水平メモリはより大きな履歴を読むのではなく、予算内で証拠を保持することに依存していることを示している。
関連論文リスト
- WorldMemArena: Evaluating Multimodal Agent Memory Through Action-World Interaction [72.1620416874118]
マルチモーダルな言語モデルは、長距離エージェントとしてますます多くデプロイされている。
既存のベンチマークは、静的対話上のリコールを測定し、メモリを1つのタスクの精度に分解し、キャプションに対する視覚的な観察を減らす。
マルチモーダルエージェントメモリを,観測可能な4段階ライフサイクルを持つアクションワールドインタラクションループとして定式化する。
論文 参考訳(メタデータ) (2026-05-28T04:27:20Z) - MemGuard: Preventing Memory Contamination in Long-Term Memory-Augmented Large Language Models [56.31411457917676]
本稿では,メモリ構築と検索において,機能的メモリ境界を保存するタイプアウェアメモリフレームワークであるMemGuardを紹介する。
幻覚と長期会話のベンチマーク全体で、MemGuardはメモリの信頼性を最大28.27%向上し、メモリトークンは以前の方法より5.8倍少ない。
論文 参考訳(メタデータ) (2026-05-27T06:04:19Z) - Mitigating Provenance-Role Collapse in Long-Term Agents via Typed Memory Representation [33.47493976010677]
本稿では,ソースモニタリングを構造制約として運用する型付きメモリ中間表現であるMemIRを提案する。
MemIRは、長期記憶を基底原子に書き、生の証拠、検索の手がかり、真理を含む主張を分離する。
LoCoMoとBEAM-100Kの実験は、MemIRが既存のメモリベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2026-05-25T13:56:31Z) - DeferMem: Query-Time Evidence Distillation via Reinforcement Learning for Long-Term Memory QA [3.56156695760535]
大規模言語モデル(LLM)エージェントは、依然として長期記憶疑問応答に苦慮している。
本稿では,この問題をハイリコール候補検索とクエリ条件のエビデンス蒸留に分離する長期記憶フレームワークであるDederMemを紹介する。
LoCoMoとLongMemEval-Sでは、DeferMemはQAの精度とメモリシステムの効率性において強力なベースラインを超えている。
論文 参考訳(メタデータ) (2026-05-21T12:36:46Z) - All-Mem: Agentic Lifelong Memory via Dynamic Topology Evolution [20.68235182577703]
All-Memは明示的で非破壊的な統合を通じて構造化されたメモリバンクを維持している。
LLM診断器は定期的にオフラインで、SPLIT、MERGE、UPDATEの3つの演算子で実行される信頼性スコアトポロジ編集を提案する。
クエリ時には、タイプドリンクはホップバウンドで、アクティブアンカーから必要に応じてアーカイブされたエビデンスへの予算付き拡張を可能にする。
論文 参考訳(メタデータ) (2026-03-20T03:14:40Z) - Fine-Mem: Fine-Grained Feedback Alignment for Long-Horizon Memory Management [63.48041801851891]
Fine-Memは、きめ細かいフィードバックアライメントのために設計された統一されたフレームワークである。
MemalphaとMemoryAgentBenchの実験は、Fin-Memが強いベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2026-01-13T11:06:17Z) - Remember Me, Refine Me: A Dynamic Procedural Memory Framework for Experience-Driven Agent Evolution [52.76038908826961]
我々は静的ストレージと動的推論のギャップを埋めるため、$textbfReMe$ ($textitRemember Me, Refine Me$)を提案する。
ReMeは3つのメカニズムを通じてメモリライフサイクルを革新する: $textitmulti-faceted distillation$, きめ細かい経験を抽出する。
BFCL-V3とAppWorldの実験では、ReMeが新しい最先端のエージェントメモリシステムを確立している。
論文 参考訳(メタデータ) (2025-12-11T14:40:01Z) - BudgetMem: Learning Selective Memory Policies for Cost-Efficient Long-Context Processing in Language Models [0.0]
BudgetMemは、すべてを記憶するのではなく、何を記憶すべきかを学ぶ、新しいメモリ拡張アーキテクチャである。
本システムでは,厳格な予算制約下での記憶にどのような価値があるかを決定するために,選択的メモリポリシーと特徴に基づくサリエンススコアを併用する。
我々の研究は、高度な言語理解能力へのアクセスを民主化し、控えめなハードウェア上で有能な長期コンテキストシステムをデプロイするための実践的な経路を提供する。
論文 参考訳(メタデータ) (2025-11-07T01:49:22Z) - Look Back to Reason Forward: Revisitable Memory for Long-Context LLM Agents [33.617262543252494]
本稿では、メモリ履歴全体からの選択的検索を可能にするコールバック強化メモリを備えたメモリ拡張エージェントReMemR1を提案する。
また,RLMLR(Reinforcement Learning with Multi-Level Rewards)を提案する。
論文 参考訳(メタデータ) (2025-09-27T01:36:46Z) - REM-Net: Recursive Erasure Memory Network for Commonsense Evidence
Refinement [130.8875535449478]
REM-Netは、答えを説明できない低品質な証拠を消去することで証拠を洗練するためのモジュールを備えている。
既存の知識ベースから証拠を取得する代わりに、REM-Netは事前訓練された生成モデルを利用して、質問用にカスタマイズされた候補証拠を生成する。
結果はREM-Netの性能を示し、洗練された証拠が説明可能であることを示します。
論文 参考訳(メタデータ) (2020-12-24T10:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。