論文の概要: Security of OpenClaw Agents: Fundamentals, Attacks, and Countermeasures
- arxiv url: http://arxiv.org/abs/2605.25435v1
- Date: Mon, 25 May 2026 05:25:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.297074
- Title: Security of OpenClaw Agents: Fundamentals, Attacks, and Countermeasures
- Title(参考訳): OpenClawエージェントのセキュリティ:基本,攻撃,対策
- Authors: Yuntao Wang, Jianle Ba, Han Liu, Yanghe Pan, Jintao Wei, Zhou Su, Tom H. Luan, Linkang Du,
- Abstract要約: OpenClawは、継続的な実行、永続メモリ、マルチチャネルインタラクション、高度な自律性を備えたスキル強化されたシステムとして動作する、オープンソースのエージェントフレームワークの新しいクラスである。
特に、高特権操作と永続メモリの組み合わせは、スキル中毒、認知操作、マルチエージェントカスケード障害、サプライチェーン脆弱性など、OpenClawエージェントを新たな脅威にさらしている。
既存のセキュリティとプライバシの脅威を階層化されたフレームワークに分類し、エージェントの推論やアクションの実行、外部とのインタラクションにおいて、脆弱性がどのように発生しているかを分析します。
- 参考スコア(独自算出の注目度): 36.008815600759156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid evolution of large language model (LLM)-driven autonomous agents has given rise to OpenClaw, a new class of open-source agent frameworks that operate as continuously running, skill-augmented systems with persistent memory, multi-channel interaction, and high degrees of autonomy. Such capabilities enable OpenClaw agents to autonomously execute complex, multi-step tasks and interact seamlessly with external applications, but simultaneously introduce a substantially enlarged attack surface. In particular, the combination of high-privilege operations and persistent memory exposes OpenClaw agents to various emerging threats, including skill poisoning, cognitive manipulation, multi-agent cascading failures, and supply-chain vulnerabilities. In this survey, we present a comprehensive study of the security landscape of OpenClaw agents. We first examine the general architecture and key characteristics that distinguish OpenClaw agents from traditional AI agent systems. We categorize existing security and privacy threats into a layered framework and analyze how vulnerabilities arise during agent reasoning, action execution, and external interaction. Representative defense mechanisms are also reviewed to draw the current defense landscape. Finally, several unresolved issues related to the reliability and trustworthiness of OpenClaw ecosystems are discussed.
- Abstract(参考訳): 大規模言語モデル(LLM)駆動の自律エージェントの急速な進化により、OpenClawが誕生した。これは、継続的な実行、永続メモリ、マルチチャネルインタラクション、高レベルの自律性を備えたスキル強化されたシステムとして動作する、オープンソースのエージェントフレームワークの新たなクラスである。
このような機能により、OpenClawエージェントは、複雑なマルチステップタスクを自律的に実行し、外部アプリケーションとシームレスに対話することが可能になる。
特に、高特権操作と永続メモリの組み合わせは、スキル中毒、認知操作、マルチエージェントカスケード障害、サプライチェーン脆弱性など、OpenClawエージェントを新たな脅威にさらしている。
本稿では,OpenClawエージェントのセキュリティ状況に関する総合的研究を紹介する。
まず、OpenClawエージェントと従来のAIエージェントシステムとを区別する一般的なアーキテクチャとキー特性について検討する。
既存のセキュリティとプライバシの脅威を階層化されたフレームワークに分類し、エージェントの推論やアクションの実行、外部とのインタラクションにおいて、脆弱性がどのように発生しているかを分析します。
代表的な防衛機構も、現在の防衛風景を描くために検討されている。
最後に、OpenClawエコシステムの信頼性と信頼性に関するいくつかの未解決問題について議論する。
関連論文リスト
- Toward Securing AI Agents Like Operating Systems [13.41373985756433]
汎用技術として,大規模言語モデル(LLM)に基づく自律エージェントが急速に出現している。
オペレーティングシステムのレンズによるLCMエージェントのセキュリティについて検討する。
エージェントシステムの安全な設計のための一連の勧告で締めくくります。
論文 参考訳(メタデータ) (2026-05-14T15:07:25Z) - DecodingTrust-Agent Platform (DTap): A Controllable and Interactive Red-Teaming Platform for AI Agents [121.77550256034]
DecodingTrust-Agent Platform (DTap)は、AIエージェントのためのコントロール可能でインタラクティブなレッドチームプラットフォームである。
DTap-Redは、多様なインジェクションベクターを探索し、効果的な攻撃戦略を自律的に発見する、最初の自律的赤チームエージェントである。
DTapを通じて、さまざまなバックボーンモデル上に構築された一般的なAIエージェントの大規模評価を行う。
論文 参考訳(メタデータ) (2026-05-06T11:59:48Z) - A Systematic Security Evaluation of OpenClaw and Its Variants [26.64519805689193]
本稿では,6つの代表的なOpenClaw-Seriesエージェントフレームワークのセキュリティ評価について述べる。
エージェント実行ライフサイクル全体にわたって、代表的な攻撃行動をカバーする205のテストケースのベンチマークを構築した。
以上の結果から, 評価されたエージェントはいずれも重大なセキュリティ上の脆弱性を示し, エージェント化されたシステムは, 基礎となるモデルよりもかなりリスクが高いことがわかった。
論文 参考訳(メタデータ) (2026-04-03T15:52:36Z) - ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers [32.10899571321103]
ClawKeeperは3つの補完的なアーキテクチャ層にまたがって多次元保護機構を統合するリアルタイムセキュリティフレームワークである。
我々は、このWatcherパラダイムが、次世代の自律エージェントシステムを保護するための基礎的なビルディングブロックとして機能する可能性を持っていると論じる。
論文 参考訳(メタデータ) (2026-03-25T15:27:54Z) - Uncovering Security Threats and Architecting Defenses in Autonomous Agents: A Case Study of OpenClaw [42.9467373594646]
本報告では,OpenClawエコシステムの総合的なセキュリティ分析について述べる。
我々は、インジェクション駆動のRemote Code Execution(RCE)、シーケンシャルツールアタックチェーン、コンテキスト記憶、サプライチェーン汚染などの重要な脆弱性を強調した。
これらのシステム的アーキテクチャ欠陥に対処するために、フルライフサイクルエージェントセキュリティアーキテクチャ(FASA)を導入します。
この理論的な防御青写真は、ゼロトラストエージェント実行、動的意図検証、および層間推論-作用相関を提唱している。
論文 参考訳(メタデータ) (2026-03-13T04:33:05Z) - Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats [29.43070870263607]
我々はOpenClawの総合的なセキュリティ脅威分析を行う。
本研究は, 間接的プロンプト注入, スキルサプライチェーン汚染, メモリ中毒, インテントドリフトなど, エージェントのライフサイクル全体にわたる脅威について検討する。
本研究は,時間的・多段階のシステム的リスクに対処する際の,現在のポイントベース防御機構の重大な欠陥を明らかにするものである。
論文 参考訳(メタデータ) (2026-03-12T07:24:05Z) - OMNI-LEAK: Orchestrator Multi-Agent Network Induced Data Leakage [59.3826294523924]
オーケストレータ設定として知られる,一般的なマルチエージェントパターンのセキュリティ脆弱性について検討する。
本報告では,フロンティアモデルの攻撃カテゴリに対する感受性を報告し,推論モデルと非推論モデルの両方が脆弱であることが確認された。
論文 参考訳(メタデータ) (2026-02-13T21:32:32Z) - Aegis: Towards Governance, Integrity, and Security of AI Voice Agents [52.7512082818639]
音声エージェントのガバナンス,整合性,セキュリティのためのフレームワークであるAegisを提案する。
我々は,銀行コールセンタ,ITサポート,ロジスティクスにおけるケーススタディを通じて,この枠組みを評価する。
モデルファミリ間の系統的な差異を観察し,より感受性の高いオープンウェイトモデルを示した。
論文 参考訳(メタデータ) (2026-02-07T05:51:36Z) - Just Ask: Curious Code Agents Reveal System Prompts in Frontier LLMs [65.6660735371212]
textbftextscJustAskは,インタラクションのみで効果的な抽出戦略を自律的に発見するフレームワークである。
これは、アッパー信頼境界に基づく戦略選択と、原子プローブと高レベルのオーケストレーションにまたがる階層的なスキル空間を用いて、オンライン探索問題として抽出を定式化する。
この結果から,現代のエージェントシステムにおいて,システムプロンプトは致命的ではあるがほぼ無防備な攻撃面であることがわかった。
論文 参考訳(メタデータ) (2026-01-29T03:53:25Z) - SafeMobile: Chain-level Jailbreak Detection and Automated Evaluation for Multimodal Mobile Agents [58.21223208538351]
本研究は,モバイルマルチモーダルエージェントを取り巻くセキュリティ問題について考察する。
行動シーケンス情報を組み込んだリスク識別機構の構築を試みる。
また、大規模言語モデルに基づく自動アセスメントスキームも設計している。
論文 参考訳(メタデータ) (2025-07-01T15:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。