論文の概要: MemMark: State-Evolution Attribution Watermarking for Agent Long-Term Memory Systems
- arxiv url: http://arxiv.org/abs/2605.25002v2
- Date: Tue, 26 May 2026 06:35:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.088515
- Title: MemMark: State-Evolution Attribution Watermarking for Agent Long-Term Memory Systems
- Title(参考訳): MemMark: エージェント長期記憶システムのための状態進化属性透かし
- Authors: Haobo Zhang, Xutao Mao, Guangyuan Dong, Ziwei Li, Xuanbo Su, Kaijie Chen, Jing Yang, Zheng Lin,
- Abstract要約: メモリベースのエージェントは、リークされたスナップショットや移行されたスナップショットを生き残るための証明を必要とする。
MemMarkは、オーナー制御シグナルを潜在メモリ書き込み決定に埋め込む。
MemMarkは、生き残ったトレース、信頼できるメタデータ、ユーティリティ劣化のない長期的なエージェントメモリで実現可能である。
- 参考スコア(独自算出の注目度): 13.133650395551507
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Memory-backed agents need provenance that can survive leaked or migrated snapshots, where logs, visible outputs, and trusted metadata may be absent. We propose MemMark, a state-evolution attribution watermark that embeds an owner-controlled signal into latent memory-write decisions. At each internal LLM call, MemMark samples among admissible candidates using keyed, distribution-preserving selection, and records cryptographic commitments with signed session anchors and reveal evidence. This makes attribution depend on reproducible backend behavior rather than mutable provenance fields. Across A-Mem and Graphiti on LoCoMo, with three LLM backbones, MemMark preserves memory utility: Overall F1 retains 99.6% of the unwatermarked baseline, while BLEU-1 changes by +0.2%. It also provides usable carrier capacity, with 1.16, 1.14, and 1.26 bits of mean entropy for update-target, link-target, and semantic-realization decisions. In the snapshot-only R3 setting, MemMark recovers the full 40-bit payload from final snapshots, while wrong-key verification remains near chance. Under nine memory-lifecycle attacks, verification distinguishes tampering, evidence deletion, and partial payload recovery. These results show that robust snapshot-only attribution is feasible for long-term agent memory without surviving traces, trusted metadata, or utility-degrading.
- Abstract(参考訳): メモリベースのエージェントは、ログ、可視出力、信頼されたメタデータが欠落している可能性がある、リークまたは移行されたスナップショットを生き残るための証明を必要とする。
本稿では,メモリ書き込み決定に所有者制御シグナルを埋め込んだ状態進化帰属型透かしであるMemMarkを提案する。
各内部LCMコールにおいて、MemMarkは、キー付き、分散保存の選択を使用して許容可能な候補のサンプルをサンプリングし、署名されたセッションアンカーとの暗号化コミットを記録し、証拠を明らかにする。
これにより、帰属は変更可能な前駆体ではなく再現可能なバックエンドの振る舞いに依存します。
3つのLCMバックボーンを持つLoCoMo上のA-MemとGraphitiでは、メモリユーティリティが保存されている: 全体的なF1は、未使用のベースラインの99.6%を保持し、BLEU-1は+0.2%変化している。
また、1.16、.14、および1.26ビットの平均エントロピーを、更新ターゲット、リンクターゲット、セマンティックリアライゼーション決定のために使用可能なキャリア容量も提供する。
スナップショットのみのR3設定では、MemMarkは最終的なスナップショットから完全な40ビットペイロードを復元する。
9つのメモリライフサイクル攻撃の下で、検証は改ざん、証拠の削除、部分的なペイロード回復を区別する。
これらの結果から,堅牢なスナップショットのみの属性は,残存トレースや信頼性メタデータ,ユーティリティ劣化を伴わない長期エージェントメモリで実現可能であることが示された。
関連論文リスト
- Same Ranking, Different Winner: How Scoring Targets Shape LLM Memory Benchmarks [2.9089118242427627]
会話記憶システムは対話履歴を事実、要約、タイムライン、および他のソースリンクされた子孫に変換する。
どのストアドフォームが検索クレジットを受け取るべきか?
このスコアリング対象の選択は、しばしば暗黙的に残され、ベンチマークの結論を実質的に変更できることを示す。
論文 参考訳(メタデータ) (2026-05-22T02:53:07Z) - MemGym: a Long-Horizon Memory Environment for LLM Agents [69.79226770543049]
本稿では,エージェントメモリのベンチマークであるMemGymを紹介する。
MemGymは、メモリパフォーマンスを推論、検索、ツール使用能力から切り離すメモリアイソレーションスコアを報告している。
MEMGYM-CODEQAとMEMGYM-DRの合成パイプラインは、長さ制御可能であり、各ステージでアブレーションを検証可能であり、下流のシナリオと密に整合している。
論文 参考訳(メタデータ) (2026-05-20T07:25:33Z) - Is One Score Enough? Rethinking the Evaluation of Sequentially Evolving LLM Memory [50.857546269660276]
本稿では,大規模言語モデル(LLM)メモリを逐次進化させる診断評価フレームワークであるSeqMem-Evalを紹介する。
最終的なパフォーマンスのみに焦点を当てるのではなく、SeqMem-Evalは、シーケンシャル推論において、メモリ状態がどのように進化し、一般化し、エクスペリエンスを集約し、有用な情報を保持するかを評価する。
論文 参考訳(メタデータ) (2026-05-14T20:15:22Z) - MemLineage: Lineage-Guided Enforcement for LLM Agent Memory [3.058164432275431]
我々は,LLMエージェントメモリの防衛機能であるMemLineageを紹介した。
最近のコンカレントな作業は、信頼できないコンテンツを永続的なエージェントの状態に書き込むことができ、後続のセッションを命令として再入力できることを示している。
MemLineageは、これをフィルタリング問題ではなく、チェーンオブカストディ問題として扱う。
論文 参考訳(メタデータ) (2026-05-14T06:07:54Z) - Mem-W: Latent Memory-Native GUI Agents [50.87647372904382]
本稿では,メモリをエージェントの連続的コンテキストの一部として扱う,潜在メモリネイティブなGUIエージェントであるMem-Wを紹介する。
4つのWebおよびモバイルナビゲーションベンチマークで、Mem-Wはさまざまなバックボーンとメモリ拡張ベースラインを一貫して改善している。
論文 参考訳(メタデータ) (2026-05-10T04:31:23Z) - Belief Memory: Agent Memory Under Partial Observability [56.41506249481312]
本稿では,メモリパラダイムを観測毎に1つの結論にシフトし,その確率で複数の結論を導出するBeliefMemを提案する。
BeliefMemは決定論的パラダイムが破棄されるという不確実性を保ち、エージェントが高い信頼を持って行動することを可能にする。
LoCoMoとALFWorldベンチマークの実証的な評価は、限られたデータであっても、BeliefMemが最高の平均パフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2026-05-07T02:03:13Z) - MemEvoBench: Benchmarking Memory MisEvolution in LLM Agents [78.95081012334116]
永続メモリを持つ大規模言語モデル(LLM)は、相互作用の継続性とパーソナライゼーションを高めるが、新たな安全性リスクをもたらす。
汚染または偏りのある記憶蓄積は、異常な作用を引き起こす可能性がある。
MemeEvoBenchは、LLMエージェントのメモリ安全性を評価する最初のベンチマークである。
論文 参考訳(メタデータ) (2026-04-17T07:29:52Z) - MemRerank: Preference Memory for Personalized Product Reranking [14.982376048234386]
本稿では,ユーザの購入履歴を簡潔でクエリ非依存な信号に抽出し,パーソナライズされた製品再品位を実現するための選好記憶フレームワークであるMemRerankを提案する。
2つのLCMベースのリランカによる実験では、MemRerankは、無メモリ、生の履歴、および既製のメモリベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-03-31T04:16:18Z) - AgentSys: Secure and Dynamic LLM Agents Through Explicit Hierarchical Memory Management [47.49917373646469]
既存の防御は肥大した記憶を与えられたまま扱い、回復力を維持することに集中する。
我々は、明示的なメモリ管理を通じて間接的なインジェクションを防御するフレームワークであるAgentSysを紹介する。
論文 参考訳(メタデータ) (2026-02-07T06:28:51Z) - InfMem: Learning System-2 Memory Control for Long-Context Agent [43.413381779578266]
InfMemは、PreThink-Retrieve-Writeプロトコルを介してSystem-2スタイルの制御をインスタンス化する制御中心のエージェントである。
32kから100Mまでの超長期のQAベンチマークでは、InfMemはバックボーン全体でMemAgentを一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-02T19:15:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。