Fugu-MT 論文翻訳(概要): Beyond Similarity: Trustworthy Memory Search for Personal AI Agents

論文の概要: Beyond Similarity: Trustworthy Memory Search for Personal AI Agents

arxiv url: http://arxiv.org/abs/2606.06054v1
Date: Thu, 04 Jun 2026 11:54:29 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-05 22:39:44.767297
Title: Beyond Similarity: Trustworthy Memory Search for Personal AI Agents
Title（参考訳）: 類似性を超えて:パーソナルAIエージェントのための信頼できるメモリ検索
Authors: Jiawen Zhang, Kejia Chen, Jiachen Ma, Yangfan Hu, Lipeng He, Yechao Zhang, Jian Liu, Xiaohu Yang, Tianwei Zhang, Ruoxi Jia,
Abstract要約: 個人AIエージェントにおける信頼境界としてのメモリ探索について検討する。 MemGateは、信頼性の高いメモリ検索のための軽量でデプロイ可能なメモリプラグインである。
参考スコア（独自算出の注目度）: 25.265839311088516
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Personal AI agents increasingly rely on long-term memory to provide persistent personalization across sessions. However, existing memory pipelines are largely driven by semantic similarity: memory data close to the current query is retrieved and injected into the model context. This creates a critical trustworthiness gap, since a semantically related memory may still be contextually inappropriate, leading to threats such as cross-domain leakage, sycophancy, tool-call drift, or memory-induced jailbreaks. In this paper, we study memory search as a trust boundary in personal AI agents. We evaluate representative agentic memory frameworks, including A-Mem, Mem0, and MemOS, together with OpenClaw, a real-world personal-agent environment with persistent state and tool-use capability. Our results show that long-term memory is not merely a utility layer, but a durable control channel that can reshape how agents interpret tasks and execute actions, leaving them highly susceptible to the aforementioned threats. To mitigate these vulnerabilities, we propose MemGate, a lightweight and deployable memory plug-in for trustworthy memory search, with only 9M parameters and a 35.1MB footprint. MemGate is inserted between the vector memory store and the backbone LLM, requiring no LLM modification, memory-database rewriting, or inference-time LLM judge. It applies a query-conditioned neural gate to candidate memory representations, turning raw similarity search into task-conditioned memory admission. Across multiple mainstream memory frameworks, real-world agent settings, and diverse LLM backbones, MemGate reduces memory-induced threats while preserving long-term memory utility.
Abstract（参考訳）: パーソナルAIエージェントは、セッション間で永続的なパーソナライズを提供するために、長期記憶に依存している。しかし、既存のメモリパイプラインは、主にセマンティックな類似性によって駆動される: 現在のクエリに近いメモリデータは、モデルコンテキストに検索され、注入される。これは、セマンティックな関連メモリがコンテキスト的に不適切である可能性があり、クロスドメインリーク、サイコファンシー、ツールコールドリフト、メモリによるジェイルブレイクなどの脅威につながるため、重要な信頼性のギャップを生じさせる。本稿では,パーソナルAIエージェントにおける信頼境界としてのメモリ探索について検討する。我々は,A-Mem,Mem0,MemOSなどの代表的なエージェントメモリフレームワークと,永続的な状態とツール使用能力を備えた実世界のパーソナルエージェント環境であるOpenClawを評価した。我々の研究結果は、長期記憶は単なるユーティリティ層ではなく、エージェントがタスクを解釈してアクションを実行する方法を再生成し、上記の脅威に対して非常に影響を受けやすい制御チャネルであることを示している。これらの脆弱性を軽減するため、信頼性の高いメモリ検索のための軽量でデプロイ可能なメモリプラグインであるMemGateを提案し、パラメータはわずか9M、フットプリントは35.1MBである。 MemGate はベクトルメモリストアとバックボーン LLM の間に挿入され、LCM の修正、メモリデータベースの書き換え、推論時間 LLM の判断を必要としない。クエリ条件のニューラルゲートを候補メモリ表現に適用し、生の類似性検索をタスク条件のメモリ入力に変換する。複数のメインストリームメモリフレームワーク、実世界のエージェント設定、多様なLCMバックボーンを通じて、MemGateは長期メモリユーティリティを保持しながら、メモリによる脅威を軽減する。

関連論文リスト

Memory is Reconstructed, Not Retrieved: Graph Memory for LLM Agents [51.30250860677378]
本稿では,連想記憶グラフとアクティブな再構成機構を組み合わせたフレームワークであるMRAgentを提案する。 Cue-Tag-Contentグラフ上で実行することで,メモリアクセスに直接推論を統合する。 LoCoMoベンチマークとLongMemEvalベンチマークの実験は、強いベースラインよりも大幅に改善されている。
論文参考訳（メタデータ） (2026-06-04T11:29:46Z)
SubtleMemory: A Benchmark for Fine-Grained Relational Memory Discrimination in Long-Horizon AI Agents [38.778004697710855]
本稿では,長期にわたるAIエージェントにおける微粒なリレーショナルメモリ識別のためのベンチマークであるSubtleMemoryを紹介する。我々は,6つのスタンドアロンメモリシステム,ネイティブメモリモジュールを持つ2つのClawスタイルエージェント,プラグインメモリモジュールを持つ3つのClawスタイルエージェントを評価した。
論文参考訳（メタデータ） (2026-06-04T06:43:11Z)
MemGym: a Long-Horizon Memory Environment for LLM Agents [69.79226770543049]
本稿では,エージェントメモリのベンチマークであるMemGymを紹介する。 MemGymは、メモリパフォーマンスを推論、検索、ツール使用能力から切り離すメモリアイソレーションスコアを報告している。 MEMGYM-CODEQAとMEMGYM-DRの合成パイプラインは、長さ制御可能であり、各ステージでアブレーションを検証可能であり、下流のシナリオと密に整合している。
論文参考訳（メタデータ） (2026-05-20T07:25:33Z)
Remembering More, Risking More: Longitudinal Safety Risks in Memory-Equipped LLM Agents [18.83666486835137]
デプロイでは、単一のエージェントが長い水平線上で多くの独立したタスクを処理し、初期のタスクの間に蓄積されたメモリは、後続の無関係なタスクの振る舞いに影響を与える可能性がある。本稿では,リードオンリーのメモリスナップショットに対して,プレフィックス長の異なる固定プローブセットを評価するトリガプローブプロトコルを提案する。このプロトコルは、レコード、メモ、フォーム、Eメール対応、および8つのメモリアーキテクチャにまたがる3つのデプロイメントシナリオに適用する。
論文参考訳（メタデータ） (2026-05-18T04:06:34Z)
Causal Intervention-Based Memory Selection for Long-Horizon LLM Agents [0.33842793760651557]
制御された介入の下で,候補記憶がモデル応答に与える影響を推定する因果記憶選択手法を提案する。以上の結果から,CMIは,信頼性の高い長期記憶には関連性のみではなく,因果的有用性に基づくコンテキスト選択が必要であることが示唆された。
論文参考訳（メタデータ） (2026-05-17T20:21:55Z)
RecMem: Recurrence-based Memory Consolidation for Efficient and Effective Long-Running LLM Agents [16.625864201773343]
RecMemは、受信するインタラクションをサブ意識のメモリ層に格納し、軽量な埋め込みモデルを使用してエンコードする。実験により、RecMemは3つのSOTAメモリシステムのメモリ構築トークンコストを最大87%削減し、精度を上回ります。
論文参考訳（メタデータ） (2026-05-15T15:17:36Z)
MemSearch-o1: Empowering Large Language Models with Reasoning-Aligned Memory Growth in Agentic Search [59.98962867649009]
本稿では,メモリ成長とリトラシングに基づくエージェント検索フレームワークであるMemSearch-o1を提案する。 MemSearch-o1はクエリからメモリシードトークンからきめ細かいメモリフラグメントを成長させ、コントリビューション関数を通じてメモリを再トレースし、深く洗練し、最終的にグローバルに接続されたメモリパスを再編成する。
論文参考訳（メタデータ） (2026-04-19T05:35:06Z)
MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution [52.29303869050117]
メモリ拡張LDMエージェントは、長期の相互作用をサポートするために外部メモリバンクを保持する。 MemMAはプラグアンドプレイのマルチエージェントフレームワークで、前方と後方の両方の経路に沿ってメモリサイクルを調整する。
論文参考訳（メタデータ） (2026-03-19T10:15:59Z)
MemoryArena: Benchmarking Agent Memory in Interdependent Multi-Session Agentic Tasks [55.145729491377374]
メモリを持つエージェントの既存の評価は、通常、単独で記憶と行動を評価する。マルチセッションメモリ-エージェント環境ループにおけるエージェントメモリのベンチマークのための統合評価ジムであるMemoryArenaを紹介する。 MemoryArenaは、Webナビゲーション、優先制約付き計画、プログレッシブ情報検索、シーケンシャルなフォーマルな推論を含む評価をサポートする。
論文参考訳（メタデータ） (2026-02-18T09:49:14Z)
Agentic Memory: Learning Unified Long-Term and Short-Term Memory Management for Large Language Model Agents [57.38404718635204]
大規模言語モデル (LLM) エージェントは、有限コンテキストウィンドウによる長距離推論において基本的な制限に直面している。既存のメソッドは通常、長期記憶(LTM)と短期記憶(STM)を独立したコンポーネントとして扱う。本稿では,エージェントのポリシーに LTM と STM 管理を直接統合する統合フレームワークである Agentic Memory (AgeMem) を提案する。
論文参考訳（メタデータ） (2026-01-05T08:24:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。