論文の概要: Security Attack and Defense Strategies for Autonomous Agent Frameworks: A Layered Review with OpenClaw as a Case Study
- arxiv url: http://arxiv.org/abs/2604.27464v1
- Date: Thu, 30 Apr 2026 06:04:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.94759
- Title: Security Attack and Defense Strategies for Autonomous Agent Frameworks: A Layered Review with OpenClaw as a Case Study
- Title(参考訳): 自律エージェントフレームワークのセキュリティ攻撃と防衛戦略--OpenClawを事例として
- Authors: Luyao Xu, Xiang Chen,
- Abstract要約: 本調査では,自律エージェントフレームワークにおけるセキュリティリスクと防衛戦略の階層的なレビューを行う。
分析を4つのセキュリティ関連レイヤ – コンテキスト層と命令層,ツール層とアクション層,ステート層と永続化層,エコシステム層とオートメーション層 – にまとめる。
自律エージェントフレームワークの脅威は、操作された入力から安全でないアクション、永続的な状態汚染、より広範なエコシステムレベルの影響に至るまで、階層にわたって伝播する可能性がある。
- 参考スコア(独自算出の注目度): 6.816972488354133
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous agent frameworks built upon large language models (LLMs) are evolving into complex, tool-integrated, and continuously operating systems, introducing security risks beyond traditional prompt-level vulnerabilities. As this paradigm is still at an early stage of development, a timely and systematic understanding of its security implications is increasingly important. Although a growing body of work has examined different attack surfaces and defense problems in agent systems, existing studies remain scattered across individual aspects of agent security, and there is still a lack of a layered review on this topic. To address this gap, this survey presents a layered review of security risks and defense strategies in autonomous agent frameworks, with OpenClaw as a case study. We organize the analysis into four security-relevant layers: the context and instruction layer, the tool and action layer, the state and persistence layer, and the ecosystem and automation layer. For each layer, we summarize its functional role, representative security risks, and corresponding defense strategies. Based on this layered analysis, we further identify that threats in autonomous agent frameworks may propagate across layers, from manipulated inputs to unsafe actions, persistent state contamination, and broader ecosystem-level impact. Finally, we highlight potential key challenges, including research imbalance across layers, the lack of long-horizon evaluation, and weak ecosystem trust models, and outline future directions toward more systematic and integrated defenses.
- Abstract(参考訳): 大規模言語モデル(LLM)上に構築された自律エージェントフレームワークは、複雑でツール統合され、継続的なオペレーティングシステムへと進化し、従来のプロンプトレベルの脆弱性を超えたセキュリティリスクを導入している。
このパラダイムはまだ開発の初期段階にあるため、セキュリティに関するタイムリーで体系的な理解がますます重要になっている。
エージェントシステムにおける様々な攻撃面や防御上の問題を調査してきた研究機関が増えているが、既存の研究はエージェントセキュリティの個々の側面に分散しており、このトピックに関する階層的なレビューはいまだにない。
このギャップに対処するため、この調査では、自律エージェントフレームワークにおけるセキュリティリスクと防衛戦略を階層的にレビューし、OpenClawをケーススタディとした。
分析を4つのセキュリティ関連レイヤ – コンテキスト層と命令層,ツール層とアクション層,ステート層と永続化層,エコシステム層とオートメーション層 – にまとめる。
各層について,その機能的役割,代表的セキュリティリスク,および対応する防衛戦略を要約する。
この階層化分析に基づいて、自動エージェントフレームワークの脅威が、操作された入力から安全でないアクション、永続的な状態汚染、より広範なエコシステムレベルの影響に至るまで、階層にわたって伝播する可能性があることをさらに特定する。
最後に、レイヤ間の研究の不均衡、長期的評価の欠如、エコシステム信頼モデルなどの潜在的な課題を強調し、より体系的で統合された防衛に向けた今後の方向性を概説する。
関連論文リスト
- Vision-Language-Action Safety: Threats, Challenges, Evaluations, and Mechanisms [61.29786895012393]
VLA(Vision-Language-Action)モデルがインボディードインテリジェンスのための統一された基盤として登場している。
この調査は、ビジョン・ランゲージ・アクションモデルにおける安全性の統一的で最新の概要を提供する。
論文 参考訳(メタデータ) (2026-04-26T15:58:19Z) - Towards Secure Retrieval-Augmented Generation: A Comprehensive Review of Threats, Defenses and Benchmarks [21.880338678029503]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルにおける幻覚とドメイン知識の欠如を、外部知識ベースを組み込むことによって著しく軽減する。
本稿では、その基盤となる脆弱性メカニズムを分析し、データ中毒、敵攻撃、メンバシップ推論攻撃などのコア脅威ベクトルを体系的に分類する。
潜在的なリスクについて深い洞察を得ることにより、この研究は、高度に堅牢で信頼性の高い次世代RAGシステムの開発を促進することを目指している。
論文 参考訳(メタデータ) (2026-03-23T07:32:59Z) - Uncovering Security Threats and Architecting Defenses in Autonomous Agents: A Case Study of OpenClaw [42.9467373594646]
本報告では,OpenClawエコシステムの総合的なセキュリティ分析について述べる。
我々は、インジェクション駆動のRemote Code Execution(RCE)、シーケンシャルツールアタックチェーン、コンテキスト記憶、サプライチェーン汚染などの重要な脆弱性を強調した。
これらのシステム的アーキテクチャ欠陥に対処するために、フルライフサイクルエージェントセキュリティアーキテクチャ(FASA)を導入します。
この理論的な防御青写真は、ゼロトラストエージェント実行、動的意図検証、および層間推論-作用相関を提唱している。
論文 参考訳(メタデータ) (2026-03-13T04:33:05Z) - Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats [29.43070870263607]
我々はOpenClawの総合的なセキュリティ脅威分析を行う。
本研究は, 間接的プロンプト注入, スキルサプライチェーン汚染, メモリ中毒, インテントドリフトなど, エージェントのライフサイクル全体にわたる脅威について検討する。
本研究は,時間的・多段階のシステム的リスクに対処する際の,現在のポイントベース防御機構の重大な欠陥を明らかにするものである。
論文 参考訳(メタデータ) (2026-03-12T07:24:05Z) - Security Risks of Agentic Vehicles: A Systematic Analysis of Cognitive and Cross-Layer Threats [0.38978027689073086]
エージェントAIは、手動運転と自律走行の両方で研究され、導入されている。
本稿では,エージェント層に影響を及ぼす他の層からのサイバー攻撃を含む,AgVのセキュリティ脅威について検討する。
重度行列とアタックチェーン分析は、小さな歪みがいかに不整合あるいは不安全な振る舞いにエスカレートするかを示している。
論文 参考訳(メタデータ) (2025-12-18T20:04:21Z) - The Evolution of Agentic AI in Cybersecurity: From Single LLM Reasoners to Multi-Agent Systems and Autonomous Pipelines [0.0]
サイバーセキュリティはエージェントAIのアーリーアダプターの1つになった。
この調査は、サイバーセキュリティにおけるエージェントAIの5世代分類を提示する。
論文 参考訳(メタデータ) (2025-12-07T05:10:16Z) - NeuroBreak: Unveil Internal Jailbreak Mechanisms in Large Language Models [68.09675063543402]
NeuroBreakは、ニューロンレベルの安全性メカニズムを分析し、脆弱性を軽減するために設計されたトップダウンのジェイルブレイク分析システムである。
レイヤワイドな表現探索分析を取り入れることで、NeuroBreakはモデルの意思決定プロセスに関する新たな視点を提供する。
本システムの有効性を検証するために,定量的評価とケーススタディを実施している。
論文 参考訳(メタデータ) (2025-09-04T08:12:06Z) - A Survey of Model Extraction Attacks and Defenses in Distributed Computing Environments [55.60375624503877]
モデル抽出攻撃(MEA)は、敵がモデルを盗み、知的財産と訓練データを公開することによって、現代の機械学習システムを脅かす。
この調査は、クラウド、エッジ、フェデレーションのユニークな特性がどのように攻撃ベクトルや防御要件を形作るのかを、緊急に理解する必要に起因している。
本研究は, 自動運転車, 医療, 金融サービスといった重要な分野において, 環境要因がセキュリティ戦略にどう影響するかを実証し, 攻撃手法と防衛機構の進化を系統的に検討する。
論文 参考訳(メタデータ) (2025-02-22T03:46:50Z) - SoK: The Security-Safety Continuum of Multimodal Foundation Models through Information Flow and Game-Theoretic Defenses [58.93030774141753]
MFM(Multimodal foundation model)は、多種多様なデータモダリティを統合し、複雑で広範囲なタスクをサポートする。
本稿では,モデル行動とシステムレベルの相互作用の両方から生じる致命的な脅威を特定することで,MFMの文脈における安全性とセキュリティの概念を統一する。
論文 参考訳(メタデータ) (2024-11-17T23:06:20Z) - PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety [70.84902425123406]
大規模言語モデル(LLM)で拡張されたマルチエージェントシステムは、集団知能において重要な能力を示す。
しかし、悪意のある目的のためにこのインテリジェンスを誤用する可能性があり、重大なリスクが生じる。
本研究では,エージェント心理学を基盤とした枠組み(PsySafe)を提案し,エージェントのダークパーソナリティ特性がリスク行動にどう影響するかを明らかにする。
実験の結果,エージェント間の集団的危険行動,エージェントが危険な行動を行う際の自己反射,エージェントの心理的評価と危険な行動との相関など,いくつかの興味深い現象が明らかになった。
論文 参考訳(メタデータ) (2024-01-22T12:11:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。