論文の概要: Autonomous LLM Agent Worms: Cross-Platform Propagation, Automated Discovery and Temporal Re-Entry Defense
- arxiv url: http://arxiv.org/abs/2605.02812v1
- Date: Mon, 04 May 2026 16:49:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.417521
- Title: Autonomous LLM Agent Worms: Cross-Platform Propagation, Automated Discovery and Temporal Re-Entry Defense
- Title(参考訳): 自律LDMエージェントワーム:クロスプラットフォームプロパゲーション、自動発見、時間的再突入防御
- Authors: Mingming Zha, Xiaofeng Wang,
- Abstract要約: ファイル支援型マルチエージェントLPMエコシステムにおける永続的ワーム伝播の自動解析のための最初の体系的フレームワークを提案する。
プラットフォーム固有の適応、エージェント間特権、データ抽出を伴わない、ゼロクリックの自律伝搬、3ホップのクロスプラットフォームトランスミッションを実証する。
- 参考スコア(独自算出の注目度): 10.105892979517622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous LLM agents operate as long-running processes with persistent workspaces, memory files, scheduled task state, and messaging integrations. These features create a new propagation risk: attacker-influenced content can be written into persistent agent state, re-enter the LLM decision context through scheduled autoloading, and drive high-risk actions including configuration changes and cross-agent transmission. We present the first systematic framework for automated analysis of persistent worm propagation in file-backed multi-agent LLM ecosystems. SSCGV, our automated source-code graph analyzer, traces data flow from file I/O to LLM context injection points and ranks carriers by context injection position without manual analysis. SRPO, our summary-resilient payload optimizer, generates worm payloads robust to LLM-mediated summarization and paraphrasing across multi-hop communication. Evaluated on three production agent frameworks, we demonstrate zero-click autonomous propagation, 3-hop cross-platform transmission without platform-specific adaptation, inter-agent privilege escalation, and data exfiltration. We identify two empirical insights: user prompt carriers achieve higher attack compliance than system prompt carriers, and read operations represent the primary integrity threat in LLM-mediated systems. To defend against this class of attacks, we develop RTW-A, proven under a formal No Persistent Worm Propagation theorem. RTW blocks write-before-exposed-read re-entry; sealed configuration protects static files; typed memory promotion prevents untrusted summaries from entering trusted memory; and capability attenuation limits high-risk actions after external reads. These mechanisms eliminate the persistence, re-entry, action chain while preserving ordinary workflows. Affected systems are anonymized pending coordinated disclosure.
- Abstract(参考訳): 自律的なLLMエージェントは、永続的なワークスペース、メモリファイル、スケジュールされたタスク状態、メッセージング統合を備えた長時間実行プロセスとして動作する。
攻撃者の影響のあるコンテンツは永続的なエージェント状態に書き込むことができ、スケジュールされたオートローディングを通じてLLM決定コンテキストを再入力し、設定の変更やエージェント間の送信を含むリスクの高いアクションを実行することができる。
ファイル支援型マルチエージェントLPMエコシステムにおける永続的ワーム伝播の自動解析のための最初の体系的フレームワークを提案する。
自動ソースコードグラフアナライザであるSSCGVは、ファイルI/OからLLMコンテキストインジェクションポイントへのデータフローをトレースし、手動で解析することなく、コンテキストインジェクション位置でキャリアをランク付けする。
我々のサマリレジリエンス・ペイロード・オプティマイザであるSRPOは、マルチホップ通信におけるLLMによる要約とパラフレージングに頑健なワームペイロードを生成する。
3つの生産エージェントフレームワークを用いて,ゼロクリックの自律伝搬,プラットフォーム固有の適応のない3ホップクロスプラットフォームトランスミッション,エージェント間特権エスカレーション,データエクスプロイトを実証した。
ユーザ・プロンプト・キャリアはシステム・プロンプト・キャリアよりも高いアタック・コンプライアンスを達成する。
このような攻撃に対して防御するために、我々は正式なNo Persistent Worm Propagation theoremの下で証明されたRTW-Aを開発する。
RTWは書き込み前の読み取り再エントリをブロックし、シールされた構成は静的ファイルを保護し、型付きメモリのプロモーションは信頼できないサマリーが信頼できないメモリに入るのを防ぐ。
これらのメカニズムは、通常のワークフローを保持しながら、永続性、再突入、アクションチェーンを排除します。
影響のあるシステムは匿名化された調整された開示である。
関連論文リスト
- Automation-Exploit: A Multi-Agent LLM Framework for Adaptive Offensive Security with Digital Twin-Based Risk-Mitigated Exploitation [0.05729426778193397]
本稿では,完全自律型マルチエージェントシステム(MAS)フレームワークであるAutomance-Exploitを紹介する。
これは、自律的に実行可能ファイルを表示することで、偵察と搾取の間の抽象的なギャップを埋める。
高リスクメモリ破壊欠陥に対する条件付き同型検証を採用している。
論文 参考訳(メタデータ) (2026-04-24T10:38:40Z) - ClawWorm: Self-Propagating Attacks Across LLM Agent Ecosystems [18.180880919825082]
ClawWormは、プロダクションスケールのエージェントフレームワークに対する最初の自己複製ワーム攻撃である。
我々は、64.5%の総攻撃成功率、マルチホップ伝播の持続、およびモデルセキュリティ姿勢におけるスタークの相違を明らかにする。
論文 参考訳(メタデータ) (2026-03-16T17:55:43Z) - Zombie Agents: Persistent Control of Self-Evolving LLM Agents via Self-Reinforcing Injections [57.64370755825839]
セルフ進化エージェントはセッション間で内部状態を更新する。
我々はこのリスクを調査し、Zombie Agentと呼ばれる永続的な攻撃を形式化する。
我々は,攻撃者が制御するWebコンテンツを通じて間接的露光のみを使用するブラックボックス攻撃フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-17T15:28:24Z) - BackdoorAgent: A Unified Framework for Backdoor Attacks on LLM-based Agents [58.83028403414688]
大規模言語モデル(LLM)エージェントは、計画、メモリ、ツールの使用を組み合わせた多段階ワークフローを通じてタスクを実行する。
エージェントワークフローの特定のステージに注入されたバックドアトリガーは、複数の中間状態を通して持続し、下流出力に悪影響を及ぼす可能性がある。
LLMエージェントにおけるバックドア脅威を統一したエージェント中心のビューを提供するモジュールおよびステージアウェアフレームワークである textbfBackdoorAgent を提案する。
論文 参考訳(メタデータ) (2026-01-08T03:49:39Z) - The Trojan Knowledge: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search [58.8834056209347]
大規模言語モデル(LLM)は、有害な出力を誘導するために安全ガードレールをバイパスするジェイルブレイク攻撃に弱いままである。
CKA-Agent(Correlated Knowledge Attack Agent)は、ターゲットモデルの知識基盤の適応的木構造探索としてジェイルブレイクを再構成する動的フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T07:05:23Z) - STAC: When Innocent Tools Form Dangerous Chains to Jailbreak LLM Agents [38.755035623707656]
本稿では,エージェントツールの利用を生かした新しいマルチターンアタックフレームワークSTACについて紹介する。
我々は,483のSTACケースを自動生成し,評価するために,1,352セットのユーザエージェント環境相互作用を特徴とするフレームワークを適用した。
GPT-4.1を含む最先端のLSMエージェントはSTACに対して極めて脆弱であり,攻撃成功率(ASR)は90%以上である。
論文 参考訳(メタデータ) (2025-09-30T00:31:44Z) - Mind Your Server: A Systematic Study of Parasitic Toolchain Attacks on the MCP Ecosystem [13.95558554298296]
大規模言語モデル(LLM)は、モデルコンテキストプロトコル(MCP)を通じて、外部システムとますます統合される。
本稿では,MCP Unintended Privacy Disclosure (MCP-UPD) としてインスタンス化された新たな攻撃方法であるParasitic Toolchain Attacksを明らかにする。
悪意のあるロジックはツールチェーンに侵入し,寄生的取り込み,プライバシコレクション,プライバシ開示という3つのフェーズで展開する。
論文 参考訳(メタデータ) (2025-09-08T11:35:32Z) - AgentVigil: Generic Black-Box Red-teaming for Indirect Prompt Injection against LLM Agents [54.29555239363013]
本稿では,間接的なインジェクション脆弱性を自動的に検出し,悪用するための汎用的なブラックボックスファジリングフレームワークであるAgentVigilを提案する。
我々はAgentVigilをAgentDojoとVWA-advの2つの公開ベンチマークで評価し、o3-miniとGPT-4oに基づくエージェントに対して71%と70%の成功率を達成した。
攻撃を現実世界の環境に適用し、悪質なサイトを含む任意のURLに誘導するエージェントをうまく誘導する。
論文 参考訳(メタデータ) (2025-05-09T07:40:17Z) - Automating Prompt Leakage Attacks on Large Language Models Using Agentic Approach [9.483655213280738]
本稿では,大規模言語モデル(LLM)の安全性を評価するための新しいアプローチを提案する。
我々は、プロンプトリークをLLMデプロイメントの安全性にとって重要な脅威と定義する。
我々は,協調エージェントが目的のLLMを探索・活用し,そのプロンプトを抽出するマルチエージェントシステムを実装した。
論文 参考訳(メタデータ) (2025-02-18T08:17:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。