論文の概要: DeltaMem: Towards Agentic Memory Management via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2604.01560v1
- Date: Thu, 02 Apr 2026 03:13:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.203517
- Title: DeltaMem: Towards Agentic Memory Management via Reinforcement Learning
- Title(参考訳): DeltaMem: 強化学習によるエージェントメモリ管理を目指して
- Authors: Qi Zhang, Shen Huang, Chu Liu, Shouqing Yang, Junbo Zhao, Haobo Wang, Pengjun Xie,
- Abstract要約: 本稿では,エージェント型メモリ管理システムDeltaMemを提案する。
メモリ更新報酬を形式化する新しいメモリベースのLevenshtein Distanceを導入し、DeltaMemの管理能力を一層高めるための強化学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 40.20038317952425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in persona-centric memory have revealed the powerful capability of multi-agent systems in managing persona memory, especially in conversational scenarios. However, these complex frameworks often suffer from information loss and are fragile across varying scenarios, resulting in suboptimal performance. In this paper, we propose DeltaMem, an agentic memory management system that formulates persona-centric memory management as an end-to-end task within a single-agent setting. To further improve the performance of our agentic memory manager, we draw inspiration from the evolution of human memory and synthesize a user-assistant dialogue dataset along with corresponding operation-level memory updating labels. Building on this, we introduce a novel Memory-based Levenshtein Distance to formalize the memory updating reward, and propose a tailored reinforcement learning framework to further enhance the management capabilities of DeltaMem. Extensive experiments show that both training-free and RL-trained DeltaMem outperform all product-level baselines across diverse long-term memory benchmarks, including LoCoMo, HaluMem, and PersonaMem.
- Abstract(参考訳): 近年のペルソナ中心メモリの進歩は、特に会話シナリオにおいて、ペルソナメモリ管理におけるマルチエージェントシステムの強力な能力を明らかにしている。
しかし、これらの複雑なフレームワークは情報損失に悩まされ、様々なシナリオにまたがって脆弱であり、結果として準最適性能をもたらす。
本稿では,エージェント型メモリ管理システムDeltaMemを提案する。
エージェントメモリマネージャの性能をさらに向上させるために、人間のメモリの進化からインスピレーションを得て、ユーザ支援対話データセットと対応する操作レベルメモリ更新ラベルを合成する。
そこで我々は,メモリ更新報酬を形式化するための新しいメモリベースのLevenshtein Distanceを導入し,DeltaMemの管理能力をさらに強化するための強化学習フレームワークを提案する。
大規模な実験によると、トレーニングなしとRLでトレーニングされたDeltaMemは、LoCoMo、HaluMem、PersonaMemなど、さまざまな長期メモリベンチマークにおいて、すべての製品レベルのベースラインを上回っている。
関連論文リスト
- Mem-T: Densifying Rewards for Long-Horizon Memory Agents [23.19373149519922]
我々は,動的更新やストリーミング入力によるマルチターン検索を行うために,軽量な階層型メモリデータベースと対話する自律メモリエージェントMem-Tを紹介する。
また,木誘導型強化学習フレームワークであるMoT-GRPOを提案する。
論文 参考訳(メタデータ) (2026-01-30T14:23:33Z) - Fine-Mem: Fine-Grained Feedback Alignment for Long-Horizon Memory Management [63.48041801851891]
Fine-Memは、きめ細かいフィードバックアライメントのために設計された統一されたフレームワークである。
MemalphaとMemoryAgentBenchの実験は、Fin-Memが強いベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2026-01-13T11:06:17Z) - EvolMem: A Cognitive-Driven Benchmark for Multi-Session Dialogue Memory [63.84216832544323]
EvolMemは、大規模言語モデル(LLM)とエージェントシステムのマルチセッションメモリ機能を評価するための新しいベンチマークである。
このベンチマークを構築するために,話題から始まる生成と物語から着想を得た変換からなるハイブリッドデータ合成フレームワークを提案する。
広範囲な評価により、LLMが全てのメモリ次元で常に他よりも優れていることが分かる。
論文 参考訳(メタデータ) (2026-01-07T03:14:42Z) - Agentic Memory: Learning Unified Long-Term and Short-Term Memory Management for Large Language Model Agents [57.38404718635204]
大規模言語モデル (LLM) エージェントは、有限コンテキストウィンドウによる長距離推論において基本的な制限に直面している。
既存のメソッドは通常、長期記憶(LTM)と短期記憶(STM)を独立したコンポーネントとして扱う。
本稿では,エージェントのポリシーに LTM と STM 管理を直接統合する統合フレームワークである Agentic Memory (AgeMem) を提案する。
論文 参考訳(メタデータ) (2026-01-05T08:24:16Z) - Dynamic Affective Memory Management for Personalized LLM Agents [1.7600011132381626]
情緒的シナリオのための新しいメモリ管理システムを提案する。
本システムは,パーソナライズ,論理コヒーレンス,精度において優れた性能を発揮する。
我々の研究は、長期記憶システムの設計に関する新たな洞察を提供する。
論文 参考訳(メタデータ) (2025-10-31T12:12:51Z) - Mem-α: Learning Memory Construction via Reinforcement Learning [20.916677456417464]
大きな言語モデル(LLM)エージェントは、限られたコンテキストウィンドウによって制約される。
現在のメモリ拡張エージェントは、メモリ更新のための事前に定義された命令とツールに依存している。
Mem-alphaは、エージェントに複雑なメモリシステムを効果的に管理するように訓練する強化学習フレームワークである。
論文 参考訳(メタデータ) (2025-09-30T08:02:34Z) - MemGen: Weaving Generative Latent Memory for Self-Evolving Agents [57.1835920227202]
本稿では,エージェントに人間的な認知機能を持たせる動的生成記憶フレームワークであるMemGenを提案する。
MemGenは、エージェントが推論を通して潜在記憶をリコールし、増大させ、記憶と認知の密接なサイクルを生み出すことを可能にする。
論文 参考訳(メタデータ) (2025-09-29T12:33:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。