論文の概要: Are We Ready For An Agent-Native Memory System?
- arxiv url: http://arxiv.org/abs/2606.24775v1
- Date: Tue, 23 Jun 2026 16:34:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:49.074451
- Title: Are We Ready For An Agent-Native Memory System?
- Title(参考訳): エージェントネイティブメモリシステムの準備はできているか?
- Authors: Wei Zhou, Xuanhe Zhou, Shaokun Han, Hongming Xu, Guoliang Li, Zhiyu Li, Feiyu Xiong, Fan Wu,
- Abstract要約: 大規模言語モデル(LLM)エージェントのメモリは、単純な検索拡張機構からデータ管理システムへと進化してきた。
既存の評価は、主にエンドツーエンドのタスク成功メトリクスを通じてエージェントメモリをベンチマークする。
データ管理の観点からエージェントメモリの系統的研究を行った。
- 参考スコア(独自算出の注目度): 37.760278978612874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Memory for large language model (LLM) agents has rapidly evolved from simple retrieval-augmented mechanisms into a data management system that supports persistent information storage, retrieval, update, consolidation, and dynamic lifecycle governance throughout agent execution. Despite this evolution, existing evaluations still benchmark agent memory mainly through end-to-end task success metrics (e.g., F1, BLEU), while treating the underlying system as a monolithic black box. As a result, critical system-level concerns, including operational costs, architectural trade-offs across memory modules, and robustness under dynamic knowledge updates, remain insufficiently explored. In this paper, we present a systematic experimental study of agent memory from a data management perspective. We propose an analytical framework that decomposes agent memory into four core modules: memory representation and storage, extraction, retrieval and routing, and maintenance. Under this framework, we evaluate 12 representative memory systems and two reference baselines across five benchmark workloads spanning 11 datasets. Our extensive end-to-end evaluation shows that no single architecture dominates across all scenarios; instead, effectiveness depends heavily on how well the memory structure aligns with the workload bottleneck. Furthermore, through fine-grained ablation studies, we quantify their individual effects on representation fidelity, retrieval precision, update correctness, and long-horizon stability. Finally, we reveal cost-performance trade-offs under realistic workloads, showing localized maintenance is more cost-efficient than global reorganization. Based on these findings, we identify promising directions towards building truly agent-native memory systems. The code is publicly available at https://github.com/OpenDataBox/MemoryData.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントのメモリは、単純な検索拡張メカニズムから、永続的な情報ストレージ、検索、更新、統合、エージェントの実行を通して動的ライフサイクルガバナンスをサポートするデータ管理システムへと急速に進化してきた。
このような進化にもかかわらず、既存の評価は、主にエンドツーエンドのタスク成功メトリクス(例えば、F1、BLEU)を通じてエージェントメモリをベンチマークし、基盤となるシステムをモノリシックなブラックボックスとして扱う。
その結果、運用コスト、メモリモジュール間のアーキテクチャトレードオフ、動的知識更新の下での堅牢性など、システムレベルの重要な懸念は、まだ十分に調査されていない。
本稿では,データ管理の観点からエージェントメモリの系統的研究を行う。
本稿では,エージェントメモリをメモリ表現と記憶,抽出,検索とルーティング,メンテナンスの4つのコアモジュールに分解する分析フレームワークを提案する。
このフレームワークでは、11のデータセットにまたがる5つのベンチマークワークロードに対して、12の代表的なメモリシステムと2つの基準ベースラインを評価します。
大規模なエンドツーエンド評価では、すべてのシナリオで単一のアーキテクチャが支配的でないことが示されています。
さらに, 微細なアブレーション研究を通じて, 表現の忠実度, 検索精度, 更新精度, 長期安定性に対する個々の効果を定量化する。
最後に、現実的なワークロード下でのコストパフォーマンスのトレードオフを明らかにし、グローバルな再編成よりも局所的なメンテナンスの方がコスト効率が高いことを示す。
これらの知見に基づき、真にエージェントネイティブなメモリシステムを構築するための有望な方向性を特定する。
コードはhttps://github.com/OpenDataBox/MemoryDataで公開されている。
関連論文リスト
- Graph-based Agent Memory: Taxonomy, Techniques, and Applications [63.70340159016138]
メモリはLarge Language Model(LLM)ベースのエージェントの中核モジュールとして出現する。
さまざまなパラダイムの中でグラフは、関係依存をモデル化する本質的な能力のため、エージェントメモリの強力な構造として際立っている。
本調査では, エージェントメモリの総合的な検討について, グラフベースの観点から述べる。
論文 参考訳(メタデータ) (2026-02-05T13:49:05Z) - MemRec: Collaborative Memory-Augmented Agentic Recommender System [57.548438733740504]
我々はメモリ管理から推論をアーキテクチャ的に分離するフレームワークであるMemRecを提案する。
MemRecは動的コラボレーティブメモリグラフを管理する専用のLM_Memを導入した。
4つのベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-01-13T18:51:16Z) - SEDM: Scalable Self-Evolving Distributed Memory for Agents [23.182291416527764]
SEDMは、メモリをパッシブリポジトリからアクティブな自己最適化コンポーネントに変換する検証可能で適応的なフレームワークである。
また,SEDMは,強いメモリベースラインに比べてトークンオーバーヘッドを低減しつつ,推論精度を向上することを示した。
結果は、SEDMをオープンエンドのマルチエージェントコラボレーションのためのスケーラブルで持続可能なメモリメカニズムとして強調する。
論文 参考訳(メタデータ) (2025-09-11T14:37:37Z) - Evaluating Memory in LLM Agents via Incremental Multi-Turn Interactions [22.190297901876278]
メモリエージェントに不可欠な4つのコア能力、すなわち、正確な検索、テスト時間学習、長距離理解、選択的忘れの4つを特定した。
既存のベンチマークは、限られたコンテキスト長に依存するか、書籍ベースのQAのような静的で長いコンテキスト設定用に調整されている。
メモリエージェント用に特別に設計された新しいベンチマークであるMemoryAgentBenchを紹介する。
論文 参考訳(メタデータ) (2025-07-07T17:59:54Z) - MemOS: A Memory OS for AI System [116.87568350346537]
大規模言語モデル(LLM)は、人工知能(AGI)にとって不可欠な基盤となっている。
既存のモデルは、主に静的パラメータと短命なコンテキスト状態に依存しており、ユーザの好みを追跡したり、長い期間にわたって知識を更新する能力を制限する。
MemOSはメモリを管理可能なシステムリソースとして扱うメモリオペレーティングシステムである。
論文 参考訳(メタデータ) (2025-07-04T17:21:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。