論文の概要: Forgetful but Faithful: A Cognitive Memory Architecture and Benchmark for Privacy-Aware Generative Agents
- arxiv url: http://arxiv.org/abs/2512.12856v1
- Date: Sun, 14 Dec 2025 21:40:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.473505
- Title: Forgetful but Faithful: A Cognitive Memory Architecture and Benchmark for Privacy-Aware Generative Agents
- Title(参考訳): Forgetful but Faithful: 認知記憶アーキテクチャとプライバシを意識した生成エージェントのベンチマーク
- Authors: Saad Alqithami,
- Abstract要約: 本稿では、生成エージェントにおける人中心記憶管理のための新しいフレームワークであるメモリ・アウェア・リテンション(MaRS)を紹介する。
本稿では,物語コヒーレンス,目標達成,社会的リコール精度,プライバシ保護,コスト効率など,エージェントのパフォーマンスを評価する総合評価フレームワークであるForgetful but Faithful Agent(FiFA)ベンチマークを提案する。
本研究は、メモリ予算エージェント評価のための新しいベンチマークを確立し、資源制約されたプライバシに敏感な環境に生成エージェントを配置するための実践的ガイドラインを提供する。
- 参考スコア(独自算出の注目度): 2.28438857884398
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As generative agents become increasingly sophisticated and deployed in long-term interactive scenarios, their memory management capabilities emerge as a critical bottleneck for both performance and privacy. Current approaches either maintain unlimited memory stores, leading to computational intractability and privacy concerns, or employ simplistic forgetting mechanisms that compromise agent coherence and functionality. This paper introduces the Memory-Aware Retention Schema (MaRS), a novel framework for human-centered memory management in generative agents, coupled with six theoretically-grounded forgetting policies that balance performance, privacy, and computational efficiency. We present the Forgetful but Faithful Agent (FiFA) benchmark, a comprehensive evaluation framework that assesses agent performance across narrative coherence, goal completion, social recall accuracy, privacy preservation, and cost efficiency. Through extensive experimentation involving 300 evaluation runs across multiple memory budgets and agent configurations, we demonstrate that our hybrid forgetting policy achieves superior performance (composite score: 0.911) while maintaining computational tractability and privacy guarantees. Our work establishes new benchmarks for memory-budgeted agent evaluation and provides practical guidelines for deploying generative agents in resource-constrained, privacy-sensitive environments. The theoretical foundations, implementation framework, and empirical results contribute to the emerging field of human-centered AI by addressing fundamental challenges in agent memory management that directly impact user trust, system scalability, and regulatory compliance.
- Abstract(参考訳): 生成エージェントがますます洗練され、長期的な対話的なシナリオにデプロイされるにつれて、そのメモリ管理能力は、パフォーマンスとプライバシの両方にとって重要なボトルネックとして現れます。
現在のアプローチでは、無制限のメモリストアを維持し、計算の難易度とプライバシの懸念につながるか、エージェントのコヒーレンスと機能性を損なう単純な忘れるメカニズムを採用するかのいずれかである。
本稿では、生成エージェントにおける人中心メモリ管理のための新しいフレームワークであるメモリ・アウェア・リテンション・スキーマ(MaRS)を紹介し、性能、プライバシ、計算効率のバランスをとるための6つの理論的根拠を忘れるポリシーを組み合わせた。
本稿では,物語コヒーレンス,目標達成,社会的リコール精度,プライバシ保護,コスト効率など,エージェントのパフォーマンスを評価する総合評価フレームワークであるForgetful but Faithful Agent(FiFA)ベンチマークを提案する。
複数のメモリ予算とエージェント構成にまたがる300の評価を含む広範囲な実験を通じて、我々のハイブリッド・リソーシング・ポリシーは、計算的トラクタビリティとプライバシ保証を維持しつつ、優れた性能(コンポジットスコア:0.911)を達成することを実証した。
本研究は、メモリ予算エージェント評価のための新しいベンチマークを確立し、資源制約されたプライバシに敏感な環境に生成エージェントを配置するための実践的ガイドラインを提供する。
理論的基盤、実装フレームワーク、実証的な結果は、ユーザ信頼、システムのスケーラビリティ、規制コンプライアンスに直接影響を与えるエージェントメモリ管理における根本的な課題に対処することによって、人間中心AIの新興分野に寄与する。
関連論文リスト
- Memory in the Age of AI Agents [217.9368190980982]
この研究は、現在のエージェントメモリ研究の最新の展望を提供することを目的としている。
我々は,エージェントメモリ,すなわちトークンレベル,パラメトリック,潜時メモリの3つの支配的実現を同定する。
実用的な開発を支援するため、メモリベンチマークとオープンソースフレームワークの包括的な概要をコンパイルする。
論文 参考訳(メタデータ) (2025-12-15T17:22:34Z) - O-Mem: Omni Memory System for Personalized, Long Horizon, Self-Evolving Agents [60.1848551962911]
O-Memはアクティブユーザプロファイリングに基づく新しいメモリフレームワークである。
O-Memはペルソナ属性とトピック関連コンテキストの階層的検索をサポートする。
論文 参考訳(メタデータ) (2025-11-17T16:55:19Z) - MemGen: Weaving Generative Latent Memory for Self-Evolving Agents [57.1835920227202]
本稿では,エージェントに人間的な認知機能を持たせる動的生成記憶フレームワークであるMemGenを提案する。
MemGenは、エージェントが推論を通して潜在記憶をリコールし、増大させ、記憶と認知の密接なサイクルを生み出すことを可能にする。
論文 参考訳(メタデータ) (2025-09-29T12:33:13Z) - Memory Management and Contextual Consistency for Long-Running Low-Code Agents [0.0]
本稿ではLCNCエージェントに特化して設計された新しいハイブリッドメモリシステムを提案する。
認知科学にインスパイアされた私たちのアーキテクチャは、エピソードとセマンティックメモリコンポーネントと、積極的な「インテリジェント・デカイ」メカニズムを組み合わせています。
鍵となるイノベーションは、LCNCパラダイムに沿ったユーザ中心の可視化インターフェースであり、非技術者のユーザがエージェントのメモリを直接管理できるようにする。
論文 参考訳(メタデータ) (2025-09-27T08:01:26Z) - VerificAgent: Domain-Specific Memory Verification for Scalable Oversight of Aligned Computer-Use Agents [0.17812428873698402]
未確認の記憶は、ユーザの意図や安全性の制約から逸脱することがある。
CUAのためのスケーラブルな監視フレームワークであるVerificAgentを紹介する。
VerificAgentはタスクの信頼性を改善し、幻覚による障害を低減し、解釈可能な監査可能なガイダンスを保持する。
論文 参考訳(メタデータ) (2025-06-03T07:25:49Z) - Scalable Multi-Agent Reinforcement Learning for Residential Load Scheduling under Data Governance [5.37556626581816]
マルチエージェント強化学習 (MARL) は, 協調型住宅負荷スケジューリング問題において, 顕著な進歩を遂げている。
MARLの最も一般的なパラダイムである集中型トレーニングは、通信制約のあるクラウドエッジ環境における大規模デプロイメントを制限する。
提案手法は,家庭の局所的な観察のみに基づく個人評論家の学習機能である,アクタ批判的手法に基づく。
論文 参考訳(メタデータ) (2021-10-06T14:05:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。