論文の概要: Novel Memory Forgetting Techniques for Autonomous AI Agents: Balancing Relevance and Efficiency
- arxiv url: http://arxiv.org/abs/2604.02280v1
- Date: Thu, 02 Apr 2026 17:14:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.964152
- Title: Novel Memory Forgetting Techniques for Autonomous AI Agents: Balancing Relevance and Efficiency
- Title(参考訳): 自律型AIエージェントのための新しいメモリ蓄積技術:妥当性と効率のバランス
- Authors: Payal Fofadiya, Sunil Tiwari,
- Abstract要約: 長期会話エージェントはコヒーレント推論のために永続記憶を必要とする。
制御不能な蓄積は 時間的劣化と 偽の記憶の伝播を引き起こす
この研究は、関連付けされたスコアリングとバウンダリされた最適化によってメモリを規制する適応的な予算付き忘れフレームワークを導入している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long-horizon conversational agents require persistent memory for coherent reasoning, yet uncontrolled accumulation causes temporal decay and false memory propagation. Benchmarks such as LOCOMO and LOCCO report performance degradation from 0.455 to 0.05 across stages, while MultiWOZ shows 78.2% accuracy with 6.8% false memory rate under persistent retention. This work introduces an adaptive budgeted forgetting framework that regulates memory through relevanceguided scoring and bounded optimization. The approach integrates recency, frequency, and semantic alignment to maintain stability under constrained context. Comparative analysis demonstrates improved long-horizon F1 beyond 0.583 baseline levels, higher retention consistency, and reduced false memory behavior without increasing context usage. These findings confirm that structured forgetting preserves reasoning performance while preventing unbounded memory growth in extended conversational settings.
- Abstract(参考訳): 長い水平の会話エージェントはコヒーレントな推論のために永続的な記憶を必要とするが、制御されていない蓄積は時間的減衰と偽の記憶伝播を引き起こす。
LOCOMOやLOOCCOなどのベンチマークでは、ステージ毎にパフォーマンスが0.455から0.05に低下し、MultiWOZは78.2%の精度で、持続的保持下での偽メモリレートは6.8%である。
この研究は、関連付けされたスコアリングとバウンダリされた最適化によってメモリを規制する適応的な予算付き忘れフレームワークを導入している。
このアプローチは、制約されたコンテキスト下で安定性を維持するために、正確性、頻度、セマンティックアライメントを統合する。
比較分析では、0.583ベースラインレベルを超えて長い水平F1が改善され、保持一貫性が向上し、コンテキスト使用量を増やすことなく偽メモリの挙動が低減された。
これらの結果から, 構造化記憶は, 会話環境における無拘束記憶の増大を防止しつつ, 推論性能を保っていることが明らかとなった。
関連論文リスト
- Multi-Layered Memory Architectures for LLM Agents: An Experimental Evaluation of Long-Term Context Retention [0.0]
ロングホライゾン対話システムは、拡張セッションを通してセマンティックドリフトと不安定なメモリ保持に悩まされる。
本稿では,対話履歴を適応的検索ゲーティングと保持規則化を備えた動作層,エピソディック層,セマンティック層に分解する多層メモリフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-31T02:58:26Z) - Developing Adaptive Context Compression Techniques for Large Language Models (LLMs) in Long-Running Interactions [0.0]
大規模言語モデル(LLM)は、コンテキスト長、メモリ飽和、計算オーバーヘッドの増大により、長時間にわたる相互作用の間、性能劣化を経験することが多い。
本稿では,重要メモリ選択,コヒーレンス・インテリジェンス・フィルタリング,動的予算配分を統合し,コンテキスト成長を制御しながら,重要な会話情報を保持する適応型コンテキスト圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-31T02:57:48Z) - Relax Forcing: Relaxed KV-Memory for Consistent Long Video Generation [73.84423888025171]
オートレグレッシブ(AR)ビデオ拡散は,近年,長大なビデオ生成において有望なパラダイムとして浮上している。
時間的劣化が進行しているため, 生成から微小スケールの地平線への延長は依然として困難であることを示す。
本稿では,AR拡散のための時間記憶機構であるRelax Forcingを紹介する。
論文 参考訳(メタデータ) (2026-03-22T18:59:24Z) - MemPO: Self-Memory Policy Optimization for Long-Horizon Agents [52.00646524941419]
既存のメソッドは通常、外部メモリモジュールを導入し、格納されたメモリから関連する情報を検索する。
本稿では,自己記憶ポリシー最適化アルゴリズム(MemPO)を提案する。
MemPOはF1の絶対スコアが25.98%、SOTAベースラインが7.1%、トークン使用率が67.58%、73.12%である。
論文 参考訳(メタデータ) (2026-02-28T14:43:02Z) - NextMem: Towards Latent Factual Memory for LLM-based Agents [58.35585202907478]
NextMemは、自動回帰型オートエンコーダを使用して、潜時メモリを効率的に構築する、潜時ファクトメモリフレームワークである。
大規模な実験は、NextMemが優れたパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-26T14:35:27Z) - Training Large Reasoning Models Efficiently via Progressive Thought Encoding [63.254758972725654]
大規模推論モデル(LRM)は複雑な問題に優れるが、効率にとって重要な障壁に直面している。
本稿では,パラメータ効率のよい微調整手法であるProgressive Thoughtを紹介する。
論文 参考訳(メタデータ) (2026-02-18T20:03:38Z) - Mem-T: Densifying Rewards for Long-Horizon Memory Agents [23.19373149519922]
我々は,動的更新やストリーミング入力によるマルチターン検索を行うために,軽量な階層型メモリデータベースと対話する自律メモリエージェントMem-Tを紹介する。
また,木誘導型強化学習フレームワークであるMoT-GRPOを提案する。
論文 参考訳(メタデータ) (2026-01-30T14:23:33Z) - Gated Differentiable Working Memory for Long-Context Language Modeling [80.27483324685434]
本稿では,Gdwm(Gated Differentiable Working Memory)を提案する。
ZeroSCROLLS と LongBench v2 の実験では、Gdwm は均一なベースラインよりも 4$times$ の勾配ステップで同等または優れたパフォーマンスを達成している。
論文 参考訳(メタデータ) (2026-01-19T10:00:33Z) - FlashMem: Distilling Intrinsic Latent Memory via Computation Reuse [4.210760734549566]
FlashMemは、計算再利用を通じて、過渡的推論状態から直接固有のメモリを蒸留するフレームワークである。
実験によると、FlashMemは5倍の推論遅延を減らしながら、重いベースラインのパフォーマンスと一致している。
論文 参考訳(メタデータ) (2026-01-09T03:27:43Z) - Stable Hadamard Memory: Revitalizing Memory-Augmented Agents for Reinforcement Learning [64.93848182403116]
現在のディープラーニングメモリモデルは、部分的に観察可能で長期にわたる強化学習環境で苦労している。
本稿では,強化学習エージェントのための新しい記憶モデルであるStable Hadamard Memoryを紹介する。
我々の手法は、部分的に観測可能なベンチマークに挑戦する上で、最先端のメモリベースの手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2024-10-14T03:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。