論文の概要: Useful Memories Become Faulty When Continuously Updated by LLMs
- arxiv url: http://arxiv.org/abs/2605.12978v1
- Date: Wed, 13 May 2026 04:15:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.806618
- Title: Useful Memories Become Faulty When Continuously Updated by LLMs
- Title(参考訳): LLMが継続的に更新すると、便利な記憶が故障する
- Authors: Dylan Zhang, Yanshan Lin, Zhengkun Wu, Yihang Sun, Bingxuan Li, Dianqi Li, Hao Peng,
- Abstract要約: 過去の経験から学ぶことは、2つの相補的な記憶から恩恵を受ける。
最近のエージェントメモリシステムは統合形式を追求している。
このような統合記憶は、有用な経験から導かれたとしても、しばしば障害となる。
- 参考スコア(独自算出の注目度): 15.1935616937967
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning from past experience benefits from two complementary forms of memory: episodic traces -- raw trajectories of what happened -- and consolidated abstractions distilled across many episodes into reusable, schema-like lessons. Recent agentic-memory systems pursue the consolidated form: an LLM rewrites past trajectories into a textual memory bank that it continuously updates with new interactions, promising self-improving agents without parameter updates. Yet we find that such consolidated memories produced by today's LLMs are often faulty even when derived from useful experiences. As consolidation proceeds, memory utility first rises, then degrades, and can fall below the no-memory baseline. More surprisingly, even when consolidating from ground-truth solutions, GPT-5.4 fails on 54% of a set of ARC-AGI problems it had previously solved without memory. We trace the regression to the consolidation step rather than the underlying experience: the same trajectories yield qualitatively different memories under different update schedules, and an episodic-only control that simply retains those trajectories remains competitive with the consolidators we test. In a controlled ARC-AGI Stream environment that exposes Retain, Delete, and Consolidate actions, agents preserve raw episodes by default and double the accuracy of their forced-consolidation counterparts; disabling consolidation entirely (episodic management only) matches this auto regime. Practically, robust agent memory should treat raw episodes as first-class evidence and gate consolidation explicitly rather than firing it after every interaction. Looking forward, reliable agentic memory will require LLMs that can consolidate without overwriting the evidence they depend on.
- Abstract(参考訳): 過去の経験から学んだことは,2つの補完的なメモリ形式 – エピソードトレース – 起きたことの生の軌跡 – と,多くのエピソードにまたがる集約された抽象化 – から恩恵を受け,再利用可能なスキーマ的なレッスンへと移行した。
LLMは過去のトラジェクトリをテキストメモリバンクに書き直し、新たなインタラクションを継続的に更新し、パラメータを更新せずに自己改善エージェントを約束する。
しかし,今日のLLMが生み出したこのような統合記憶は,有用な経験から導いたとしてもしばしば不良であることがわかった。
コンソリデーションが進むにつれて、まずメモリユーティリティが上昇し、次に劣化し、非メモリベースライン以下に落ちます。
さらに驚くべきことに、GPT-5.4は、かつてメモリ無しで解決されたARC-AGI問題の54%で失敗した。
同じ軌跡は異なる更新スケジュール下で定性的に異なる記憶を生じさせ、これらの軌跡を単に保持するエピソードのみの制御は、我々がテストしたコンソリエータと競合するままである。
Retain、Delete、Consolidateアクションを公開するコントロールされたARC-AGI Stream環境では、エージェントは生のエピソードをデフォルトで保存し、強制統合の精度を2倍にします。
実際、堅牢なエージェントメモリは、生のエピソードをあらゆる相互作用の後に発射するのではなく、一級の証拠として扱い、ゲートを明示的に統合するべきである。
今後は、信頼できるエージェントメモリは、彼らが依存する証拠を上書きすることなく統合できるLCMを必要とするだろう。
関連論文リスト
- The Trap of Trajectory: Towards Understanding and Mitigating Spurious Correlations in Agentic Memory [7.707732051915869]
エージェントメモリシステムの診断では、メモリはクリーンな入力の推論を改善するが、それらが存在するときのスプリアスパターンへの依存を増幅する。
本稿では,CAMELを提案する。CAMELは,書き込み時間と検索時間の両方で,多様なメモリアーキテクチャ間で動作可能な,プラグアンドプレイキャリブレーション方式である。
全体として、CAMELはより信頼性の高いエージェントメモリデプロイメントに対して、原則的で軽量なソリューションを提供する。
論文 参考訳(メタデータ) (2026-05-10T05:04:13Z) - The Memory Curse: How Expanded Recall Erodes Cooperative Intent in LLM Agents [35.23790156883985]
アクセス可能な履歴を拡張することで、28のモデルのうち18の協力関係が悪化する。
第一に、378,000の推論の語彙解析は、パラノイアの上昇よりも前方の意図を侵食してこの崩壊を辿る。
第2に、記憶の衛生化は、目に見える歴史を合成協調記録に置き換えつつ、即時的な長さを保ち、実質的に協調を回復させる。
第三に、明示的な因果関係を非難することは、しばしば崩壊を減少させ、議論がパラドックス的に記憶の呪いを増幅することを示す。
論文 参考訳(メタデータ) (2026-05-08T17:47:13Z) - Continual Knowledge Updating in LLM Systems: Learning Through Multi-Timescale Memory Dynamics [5.113513399537608]
我々は、外部記憶は生物学的記憶と同様の原理に従うべきだと主張している。
Meminiでは、この見解は、知識を有向グラフとして整理する連想記憶の形を取る。
論文 参考訳(メタデータ) (2026-05-06T16:33:42Z) - MemEvoBench: Benchmarking Memory MisEvolution in LLM Agents [78.95081012334116]
永続メモリを持つ大規模言語モデル(LLM)は、相互作用の継続性とパーソナライゼーションを高めるが、新たな安全性リスクをもたらす。
汚染または偏りのある記憶蓄積は、異常な作用を引き起こす可能性がある。
MemeEvoBenchは、LLMエージェントのメモリ安全性を評価する最初のベンチマークである。
論文 参考訳(メタデータ) (2026-04-17T07:29:52Z) - MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution [52.29303869050117]
メモリ拡張LDMエージェントは、長期の相互作用をサポートするために外部メモリバンクを保持する。
MemMAはプラグアンドプレイのマルチエージェントフレームワークで、前方と後方の両方の経路に沿ってメモリサイクルを調整する。
論文 参考訳(メタデータ) (2026-03-19T10:15:59Z) - MemRec: Collaborative Memory-Augmented Agentic Recommender System [57.548438733740504]
我々はメモリ管理から推論をアーキテクチャ的に分離するフレームワークであるMemRecを提案する。
MemRecは動的コラボレーティブメモリグラフを管理する専用のLM_Memを導入した。
4つのベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-01-13T18:51:16Z) - Remember Me, Refine Me: A Dynamic Procedural Memory Framework for Experience-Driven Agent Evolution [52.76038908826961]
我々は静的ストレージと動的推論のギャップを埋めるため、$textbfReMe$ ($textitRemember Me, Refine Me$)を提案する。
ReMeは3つのメカニズムを通じてメモリライフサイクルを革新する: $textitmulti-faceted distillation$, きめ細かい経験を抽出する。
BFCL-V3とAppWorldの実験では、ReMeが新しい最先端のエージェントメモリシステムを確立している。
論文 参考訳(メタデータ) (2025-12-11T14:40:01Z) - Agentic Learner with Grow-and-Refine Multimodal Semantic Memory [50.81667005063605]
ViLoMemは、コンパクトなスキーマベースのメモリを構築するデュアルストリームメモリフレームワークである。
視覚的障害パターンと論理的推論エラーを符号化し、MLLMが成功し失敗した経験から学ぶことを可能にする。
論文 参考訳(メタデータ) (2025-11-26T18:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。