論文の概要: AdaMem: Learning What to Remember for Personalized Long-Horizon LLM Agents
- arxiv url: http://arxiv.org/abs/2606.21144v1
- Date: Fri, 19 Jun 2026 06:35:52 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-23 11:22:19.625982
- Title: AdaMem: Learning What to Remember for Personalized Long-Horizon LLM Agents
- Title(参考訳): AdaMem:パーソナライズされたLLMエージェントで覚えるべきこと
- Authors: Xingyu Chen, Rui Wang, Zhaopeng Tu, Liefeng Bo,
- Abstract要約: 我々は、記憶に値するものはロール依存であり、 textbfAdaMem (Adaptive Memory)を提案する。
AdaMemは、メモリ容量をtextbf9%削減しながら、均一なMem0ベースライン上で textbf+9.0% まで精度を向上する。
- 参考スコア(独自算出の注目度): 79.03892269184145
- License:
- Abstract: Long-term memory systems for Large Language Model (LLM) agents typically try to \emph{remember everything}, extracting memories uniformly to retain as many facts as possible. In production, however, inference cost and finite context budgets make this untenable: beyond consolidating raw dialogue into memory, an agent must exert \emph{write control}, efficiently keeping only the information each user actually cares about. Otherwise, long-horizon personalized interactions suffer \emph{memory bloat}, where irrelevant trivia crowds out useful information and steadily erodes question-answering (QA) accuracy. We argue that what is worth remembering is role-dependent, and propose \textbf{AdaMem} (Adaptive Memory), a method that \emph{learns what to remember} for each user from feedback. AdaMem maintains a structured, role-specific Memory Policy and refines it from weekly QA feedback through a lightweight, patch-style self-reflection step with failure rollback. To study this setting, we build \textbf{AdaMem-Bench}, a benchmark that simulates weeks of interaction with week-by-week QA. Across two extraction models and two feedback modes, AdaMem improves QA accuracy by up to \textbf{+9.0\%} over the uniform Mem0 baseline while shrinking memory volume by \textbf{9\%}.
- Abstract(参考訳): LLM(Large Language Model)エージェントのための長期記憶システムは、通常、可能な限り多くの事実を保持するためにメモリを均一に抽出する、emph{remember everything} を試みている。
しかし、本番環境では、推論コストと有限コンテキスト予算により、このことは不可能である:生の対話をメモリに集約する以外に、エージェントは \emph{write control} を実行し、ユーザが実際に関心を持っている情報のみを効率的に保持しなければならない。
そうでなければ、長期にわたるパーソナライズされたインタラクションは、無関係なトリビアが有用な情報を収集し、質問回答(QA)の精度を着実に損なうという、"emph{Memory bloat}"に苦しむ。
我々は、記憶に値するものはロール依存であると主張し、フィードバックから各ユーザに対して、記憶すべきものをemph{learnするメソッドである、textbf{AdaMem} (Adaptive Memory)を提案する。
AdaMemは構造化されたロール固有のメモリポリシーを維持し、障害のロールバックを備えた軽量なパッチスタイルのセルフリフレクションステップを通じて、毎週のQAフィードバックから改善する。
この設定を研究するために、週毎のQAとの週単位のインタラクションをシミュレートするベンチマークである \textbf{AdaMem-Bench} を構築した。
2つの抽出モデルと2つのフィードバックモードで、AdaMemは、メモリ容量を \textbf{9\%} に縮小しながら、均一なMem0ベースライン上で \textbf{+9.0\%} まで精度を向上する。
関連論文リスト
- Enhancing Software Engineering Through Closed-Loop Memory Optimization [50.418699819003486]
ソフトウェア工学 (SE) エージェントにおけるメモリ拡張のためのクローズドループフレームワークである ours を紹介する。
タスクに依存しない textbf ベンチマークとアノテーションのない textbf 最適化信号としての有用性を確立する。
その結果、SEエージェントは設定によって常に改善され、成功率で$uparrow5.25%、解決効率で$uparrow4.63%という絶対的なゲインが得られることが示された。
論文 参考訳(メタデータ) (2026-06-04T03:17:21Z) - MemGym: a Long-Horizon Memory Environment for LLM Agents [69.79226770543049]
本稿では,エージェントメモリのベンチマークであるMemGymを紹介する。
MemGymは、メモリパフォーマンスを推論、検索、ツール使用能力から切り離すメモリアイソレーションスコアを報告している。
MEMGYM-CODEQAとMEMGYM-DRの合成パイプラインは、長さ制御可能であり、各ステージでアブレーションを検証可能であり、下流のシナリオと密に整合している。
論文 参考訳(メタデータ) (2026-05-20T07:25:33Z) - DimMem: Dimensional Structuring for Efficient Long-Term Agent Memory [9.059024668312434]
DimMemは、各メモリを時間、場所、理由、目的、キーワードなどの明示的なフィールドを持つアトミック、型付き、自己完結したユニットとして表現する。
LoCoMo-10 と LongMemEval-S 全体で、DimMem は textbf81.43% と textbf78.20% の総合精度をそれぞれ達成している。
論文 参考訳(メタデータ) (2026-05-15T09:20:31Z) - MemRerank: Preference Memory for Personalized Product Reranking [14.982376048234386]
本稿では,ユーザの購入履歴を簡潔でクエリ非依存な信号に抽出し,パーソナライズされた製品再品位を実現するための選好記憶フレームワークであるMemRerankを提案する。
2つのLCMベースのリランカによる実験では、MemRerankは、無メモリ、生の履歴、および既製のメモリベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-03-31T04:16:18Z) - AdaMem: Adaptive User-Centric Memory for Long-Horizon Dialogue Agents [49.63422082885992]
長軸対話エージェントのための適応型ユーザ中心メモリフレームワークであるAdaMemを提案する。
AdaMemは対話履歴をワーキング、エピソディック、ペルソナ、グラフメモリに整理する。
LoCoMo と PERSONAMEM ベンチマーク上での AdaMem の評価を行った。
論文 参考訳(メタデータ) (2026-03-17T13:22:54Z) - OP-Bench: Benchmarking Over-Personalization for Memory-Augmented Personalized Conversational Agents [55.27061195244624]
オーバーパーソナライゼーションを3つのタイプに分類する。
エージェントは不要な場合でも、ユーザメモリを取得およびオーバーアタッチする傾向があります。
我々の研究は、メモリ拡張対話システムにおいて、より制御可能で適切なパーソナライズに向けた最初の一歩を踏み出した。
論文 参考訳(メタデータ) (2026-01-20T08:27:13Z) - MEM1: Learning to Synergize Memory and Reasoning for Efficient Long-Horizon Agents [84.62985963113245]
我々は,長時間のマルチターンタスクに対して,エージェントが一定のメモリで動作可能な,エンドツーエンドの強化学習フレームワークMEM1を紹介する。
各ターンでMEM1は、メモリ統合と推論を共同でサポートするコンパクトな共有内部状態を更新する。
その結果,MEM1-7Bは16目的のマルチホップQAタスクにおいて,Qwen2.5-14B-Instructと比較してメモリ使用量を3.7倍削減し,3.5倍の性能向上を示す。
論文 参考訳(メタデータ) (2025-06-18T19:44:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。