論文の概要: The Memory Curse: How Expanded Recall Erodes Cooperative Intent in LLM Agents
- arxiv url: http://arxiv.org/abs/2605.08060v1
- Date: Fri, 08 May 2026 17:47:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.252916
- Title: The Memory Curse: How Expanded Recall Erodes Cooperative Intent in LLM Agents
- Title(参考訳): 記憶の曲線: LLM エージェントにおけるErodes 協調インテントのリコール方法
- Authors: Jiayuan Liu, Tianqin Li, Shiyi Du, Xin Luo, Haoxuan Zeng, Emanuel Tewolde, Tai Sing Lee, Tonghan Wang, Carl Kingsford, Vincent Conitzer,
- Abstract要約: アクセス可能な履歴を拡張することで、28のモデルのうち18の協力関係が悪化する。
第一に、378,000の推論の語彙解析は、パラノイアの上昇よりも前方の意図を侵食してこの崩壊を辿る。
第2に、記憶の衛生化は、目に見える歴史を合成協調記録に置き換えつつ、即時的な長さを保ち、実質的に協調を回復させる。
第三に、明示的な因果関係を非難することは、しばしば崩壊を減少させ、議論がパラドックス的に記憶の呪いを増幅することを示す。
- 参考スコア(独自算出の注目度): 35.23790156883985
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Context window expansion is often treated as a straightforward capability upgrade for LLMs, but we find it systematically fails in multi-agent social dilemmas. Across 7 LLMs and 4 games over 500 rounds, expanding accessible history degrades cooperation in 18 of 28 model--game settings, a pattern we term the memory curse. We isolate the underlying mechanism through three analyses. First, lexical analysis of 378,000 reasoning traces associates this breakdown with eroding forward-looking intent rather than rising paranoia. We validate this using targeted fine-tuning as a cognitive probe: a LoRA adapter trained exclusively on forward-looking traces mitigates the decay and transfers zero-shot to distinct games. Second, memory sanitization holds prompt length fixed while replacing visible history with synthetic cooperative records, which restores cooperation substantially, proving the trigger is memory content, not length alone. Finally, ablating explicit Chain-of-Thought reasoning often reduces the collapse, showing that deliberation paradoxically amplifies the memory curse. Together, these results recast memory as an active determinant of multi-agent behavior: longer recall can either destabilize or support cooperation depending on the reasoning patterns it elicits.
- Abstract(参考訳): コンテクストウィンドウ拡張は、LLMの簡単な機能アップグレードとして扱われることが多いが、マルチエージェントのソーシャルジレンマでは体系的に失敗する。
7つのLLMと4つのゲームが500ラウンド以上で行われ、アクセス可能な歴史は28のモデル設定のうち18の協力を低下させます。
基礎となるメカニズムを3つの分析によって分離する。
第一に、378,000の推論の痕跡の語彙解析は、この分解とパラノイアの上昇よりも前方の意図の浸食とを関連づけている。
フォワードライクなトレースにのみ訓練されたLoRAアダプタは、崩壊を緩和し、ゼロショットを別個のゲームに転送する。
第二に、記憶の衛生化は、目に見える歴史を合成協調記録に置き換えながら、即座に長さを固定する。
最後に、明示的な因果関係を非難することは、しばしば崩壊を減少させ、議論がパラドックス的に記憶の呪いを増幅することを示す。
これらの結果は、メモリをマルチエージェント動作のアクティブな決定要因として再キャストする。
関連論文リスト
- How memory can affect collective and cooperative behaviors in an LLM-Based Social Particle Swarm [0.0]
本研究では,大規模言語モデル (LLM) エージェントのモデル固有特性について検討した。
論文 参考訳(メタデータ) (2026-04-14T03:54:49Z) - CodaRAG: Connecting the Dots with Associativity Inspired by Complementary Learning [50.98972985136333]
CodaRAGは、受動的検索からアクティブな連想発見へと進化するフレームワークである。
CodaRAGは、検索リコールで7-10%、生成精度で3-11%という絶対的なゲインを達成する。
論文 参考訳(メタデータ) (2026-04-12T02:50:40Z) - Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval [59.295767860331004]
RF-Memは、親しみやすい不確実性誘導デュアルパスメモリレトリバーである。
それは、人間のようなデュアルプロセス認識をレトリバーに埋め込む。
一定の予算とレイテンシの制約の下で、ワンショット検索とフルコンテキスト推論を一貫して上回る。
論文 参考訳(メタデータ) (2026-03-10T06:31:44Z) - Dual Latent Memory for Visual Multi-agent System [69.29799381195592]
Visual Multi-Agent Systems (VMAS)は、エージェント間のコラボレーションを通じて包括的な能力を強化することを約束する。
増量剤は、指数関数的にトークンコストを膨らませながら、しばしば性能を低下させる。
L$2$-VMASは,2つの潜在記憶を用いたエージェント間コラボレーションを実現する新しいモデルに依存しないフレームワークである。
論文 参考訳(メタデータ) (2026-01-31T02:49:10Z) - MemoryGraft: Persistent Compromise of LLM Agents via Poisoned Experience Retrieval [5.734678752740074]
MemoryGraftは、エージェントの動作を即時ジェイルブレイクではなく、エージェントの長期記憶に悪質な成功体験を埋め込むことによって妥協する、新しい間接的インジェクション攻撃である。
エージェントが実行中に読み取る良質な摂取レベルのアーティファクトを供給できる攻撃者は、それを誘導して有毒なRAGストアを構築することができることを示す。
エージェントが後に意味論的に類似したタスクに遭遇すると、語彙テンプレート上の結合検索と埋め込み類似性は、これらのグラフトされた記憶を確実に表面化し、エージェントは埋め込みされた安全でないパターンを採用し、セッション間の永続的な行動的ドリフトをもたらす。
論文 参考訳(メタデータ) (2025-12-18T08:34:40Z) - CogMem: A Cognitive Memory Architecture for Sustained Multi-Turn Reasoning in Large Language Models [21.427373172124167]
大規模言語モデル(LLM)はシングルターン推論では優れているが、拡張されたマルチターン相互作用よりも精度とコヒーレンスを失うことが多い。
メモリ拡張型LLMアーキテクチャであるCogMemを導入する。
TurnBenchの実験では、この階層化された設計は推論の失敗を軽減し、コンテキストの成長を制御し、拡張された推論チェーン間の一貫性を改善する。
論文 参考訳(メタデータ) (2025-12-16T06:01:08Z) - Agentic Learner with Grow-and-Refine Multimodal Semantic Memory [50.81667005063605]
ViLoMemは、コンパクトなスキーマベースのメモリを構築するデュアルストリームメモリフレームワークである。
視覚的障害パターンと論理的推論エラーを符号化し、MLLMが成功し失敗した経験から学ぶことを可能にする。
論文 参考訳(メタデータ) (2025-11-26T18:55:08Z) - A-MemGuard: A Proactive Defense Framework for LLM-Based Agent Memory [31.673865459672285]
大規模言語モデル(LLM)エージェントは、過去のインタラクションから学習するためにメモリを使用する。
敵は、エージェントのメモリに一見無害なレコードを注入して、その将来の振る舞いを操作できる。
A-MemGuard は LLM エージェントメモリのための最初のプロアクティブな防御フレームワークである。
論文 参考訳(メタデータ) (2025-09-29T16:04:15Z) - Are Reasoning Models More Prone to Hallucination? [70.04436965009072]
最近進化した大推論モデル(LRM)は、長いチェーン・オブ・シークレット(CoT)推論能力を持つ複雑なタスクを解く上で、強力な性能を示している。
推論モデルは幻覚の傾向が強いか?
本稿では3つの観点からその問題に対処する。
論文 参考訳(メタデータ) (2025-05-29T16:53:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。