論文の概要: Mind Your HEARTBEAT! Claw Background Execution Inherently Enables Silent Memory Pollution
- arxiv url: http://arxiv.org/abs/2603.23064v2
- Date: Wed, 25 Mar 2026 13:55:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 14:25:26.08009
- Title: Mind Your HEARTBEAT! Claw Background Execution Inherently Enables Silent Memory Pollution
- Title(参考訳): HEARTBEATを心に留めて! 秘密のメモリ汚染を防げる爪の背景
- Authors: Yechao Zhang, Shiqian Zhao, Jie Zhang, Gelei Deng, Jiawen Zhang, Xiaogeng Liu, Chaowei Xiao, Tianwei Zhang,
- Abstract要約: この脆弱性はClawエコシステム全体で共有されるアーキテクチャ設計から生じる。
外部ソースから取り込まれたコンテンツは、フォアグラウンドインタラクションに使用される同じメモリコンテキストに入ることができる。
私たちはMissClawを使ってエージェントネイティブな社会設定でこの経路をインスタンス化する。
- 参考スコア(独自算出の注目度): 55.87577638514179
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We identify a critical security vulnerability in mainstream Claw personal AI agents: untrusted content encountered during heartbeat-driven background execution can silently pollute agent memory and subsequently influence user-facing behavior without the user's awareness. This vulnerability arises from an architectural design shared across the Claw ecosystem: heartbeat background execution runs in the same session as user-facing conversation, so content ingested from any external source monitored in the background (including email, message channels, news feeds, code repositories, and social platforms) can enter the same memory context used for foreground interaction, often with limited user visibility and without clear source provenance. We formalize this process as an Exposure (E) $\rightarrow$ Memory (M) $\rightarrow$ Behavior (B) pathway: misinformation encountered during heartbeat execution enters the agent's short-term session context, potentially gets written into long-term memory, and later shapes downstream user-facing behavior. We instantiate this pathway in an agent-native social setting using MissClaw, a controlled research replica of Moltbook. We find that (1) social credibility cues, especially perceived consensus, are the dominant driver of short-term behavioral influence, with misleading rates up to 61%; (2) routine memory-saving behavior can promote short-term pollution into durable long-term memory at rates up to 91%, with cross-session behavioral influence reaching 76%; (3) under naturalistic browsing with content dilution and context pruning, pollution still crosses session boundaries. Overall, prompt injection is not required: ordinary social misinformation is sufficient to silently shape agent memory and behavior under heartbeat-driven background execution.
- Abstract(参考訳): ハートビート駆動のバックグラウンド実行中に発生する信頼できないコンテンツは、エージェントのメモリを静かに汚染し、ユーザを意識せずに、ユーザによる振る舞いに影響を与える可能性がある。
この脆弱性は,Clawエコシステム全体で共有されるアーキテクチャ設計から生じるものだ。 心拍バックグラウンド実行は,ユーザとの会話と同じセッションで実行されるため,バックグラウンドで監視されている外部ソース(メール,メッセージチャネル,ニュースフィード,コードリポジトリ,ソーシャルプラットフォームなど)から取り込まれたコンテントは,フォアグラウンドインタラクションに使用されるのと同じメモリコンテキストに入力することができる。
このプロセスは、Exposure (E) $\rightarrow$ Memory (M) $\rightarrow$ Behavior (B) パスとして形式化されます。
この経路をMltbookの制御された研究レプリカであるMissClawを用いてエージェントネイティブな社会設定でインスタンス化する。
その結果,(1)社会的信頼性の指標,特にコンセンサスが,短期的行動影響の主要な要因であり,誤解を招く確率は最大61%,(2)日常的メモリ保存行動は短期的環境汚染を最大91%に促進し,断続的行動影響は最大76%,(3)コンテンツ希釈とコンテキストプルーニングを併用した自然主義的なブラウジングにおいては,汚染はセッション境界を越えていることがわかった。
一般的には即時注射は必要とされない: 通常の社会的誤報は、心拍駆動のバックグラウンド実行下で、エージェントの記憶と振る舞いを静かに形作るのに十分である。
関連論文リスト
- MemoryArena: Benchmarking Agent Memory in Interdependent Multi-Session Agentic Tasks [55.145729491377374]
メモリを持つエージェントの既存の評価は、通常、単独で記憶と行動を評価する。
マルチセッションメモリ-エージェント環境ループにおけるエージェントメモリのベンチマークのための統合評価ジムであるMemoryArenaを紹介する。
MemoryArenaは、Webナビゲーション、優先制約付き計画、プログレッシブ情報検索、シーケンシャルなフォーマルな推論を含む評価をサポートする。
論文 参考訳(メタデータ) (2026-02-18T09:49:14Z) - Zombie Agents: Persistent Control of Self-Evolving LLM Agents via Self-Reinforcing Injections [57.64370755825839]
セルフ進化エージェントはセッション間で内部状態を更新する。
我々はこのリスクを調査し、Zombie Agentと呼ばれる永続的な攻撃を形式化する。
我々は,攻撃者が制御するWebコンテンツを通じて間接的露光のみを使用するブラックボックス攻撃フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-17T15:28:24Z) - Stateless Yet Not Forgetful: Implicit Memory as a Hidden Channel in LLMs [13.390425803544785]
暗黙の記憶を導入し、モデルが他の独立した相互作用をまたいで状態を運ぶ能力を導入します。
デモとして、時間爆弾と呼ばれる新しい時間的バックドアを紹介します。
我々は,隠蔽型エージェント間通信,ベンチマーク汚染,ターゲット操作,トレーニングデータ中毒など,暗黙記憶の幅広い意味を分析した。
論文 参考訳(メタデータ) (2026-02-09T12:01:32Z) - When Personalization Legitimizes Risks: Uncovering Safety Vulnerabilities in Personalized Dialogue Agents [49.341830745910194]
本稿では,パーソナライズされたエージェントの安全性障害である意図的正当性を明らかにする。
我々の研究は、安全障害モードとしての意図的正当性の最初の体系的な調査と評価を提供する。
論文 参考訳(メタデータ) (2026-01-25T15:42:01Z) - AI Agents Need Memory Control Over More Context [0.0]
そこで本研究では,書き起こしのリプレイを,各ターンにオンライン更新された有界な内部状態に置き換えるバイオインスパイアされたメモリコントローラを提案する。
ACCは境界メモリを一貫して維持し、より安定したマルチターン動作を示す。
その結果,認知的圧縮は,長期的AIエージェントにおいて,信頼性の高い記憶制御のための実用的で効果的な基礎を提供することが示された。
論文 参考訳(メタデータ) (2026-01-15T18:01:59Z) - Controllable Memory Usage: Balancing Anchoring and Innovation in Long-Term Human-Agent Interaction [35.20324450282101]
エージェントのメモリ依存を明示的かつユーザ制御可能な次元としてモデル化できることを示す。
textbfSteerable textbfMemory Agent, textttSteeMを提案する。
論文 参考訳(メタデータ) (2026-01-08T16:54:30Z) - MemoryGraft: Persistent Compromise of LLM Agents via Poisoned Experience Retrieval [5.734678752740074]
MemoryGraftは、エージェントの動作を即時ジェイルブレイクではなく、エージェントの長期記憶に悪質な成功体験を埋め込むことによって妥協する、新しい間接的インジェクション攻撃である。
エージェントが実行中に読み取る良質な摂取レベルのアーティファクトを供給できる攻撃者は、それを誘導して有毒なRAGストアを構築することができることを示す。
エージェントが後に意味論的に類似したタスクに遭遇すると、語彙テンプレート上の結合検索と埋め込み類似性は、これらのグラフトされた記憶を確実に表面化し、エージェントは埋め込みされた安全でないパターンを採用し、セッション間の永続的な行動的ドリフトをもたらす。
論文 参考訳(メタデータ) (2025-12-18T08:34:40Z) - O-Mem: Omni Memory System for Personalized, Long Horizon, Self-Evolving Agents [60.1848551962911]
O-Memはアクティブユーザプロファイリングに基づく新しいメモリフレームワークである。
O-Memはペルソナ属性とトピック関連コンテキストの階層的検索をサポートする。
論文 参考訳(メタデータ) (2025-11-17T16:55:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。