論文の概要: Toward Securing AI Agents Like Operating Systems
- arxiv url: http://arxiv.org/abs/2605.14932v1
- Date: Thu, 14 May 2026 15:07:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.899627
- Title: Toward Securing AI Agents Like Operating Systems
- Title(参考訳): オペレーティングシステムのようなAIエージェントのセキュア化に向けて
- Authors: Lukas Pirch, Micha Horlboge, Patrick Großmann, Syeda Mahnur Asif, Klim Kireev, Thorsten Holz, Konrad Rieck,
- Abstract要約: 汎用技術として,大規模言語モデル(LLM)に基づく自律エージェントが急速に出現している。
オペレーティングシステムのレンズによるLCMエージェントのセキュリティについて検討する。
エージェントシステムの安全な設計のための一連の勧告で締めくくります。
- 参考スコア(独自算出の注目度): 13.41373985756433
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous agents based on large language models (LLMs) are rapidly emerging as a general-purpose technology, with recent systems such as OpenClaw extending their capabilities through broad tool use, third-party skills, and deeper integration into user environments. At the same time, these agentic systems introduce substantial security risks by combining unconstrained capabilities with access to sensitive user data. In this work, we investigate the security of LLM-based agents through the lens of operating systems. We argue that both face strikingly similar challenges in isolating resources, separating privileges, and mediating communication. Guided by this perspective, we survey the current landscape of open-source agents, derive a unified agent architecture, and systematically analyze potential attack vectors. To validate this analysis, we conduct a case study evaluating four widely used OpenClaw-like agents. Even under modest attacker capabilities, we find that several protection mechanisms fail in practice and that secure operation requires detailed system knowledge and careful configuration. However, we also observe that while some agentic capabilities remain insecure by design, many vulnerabilities can be mitigated using well-established techniques from operating system security. We conclude with a set of recommendations for the secure design of agentic systems.
- Abstract(参考訳): 大規模言語モデル(LLM)に基づく自律エージェントは、汎用技術として急速に普及しており、OpenClawのような最近のシステムは、幅広いツールの使用、サードパーティのスキル、ユーザ環境へのより深い統合を通じて、その能力を拡張している。
同時に、これらのエージェントシステムは、制約のない機能と機密データへのアクセスを組み合わせることで、重大なセキュリティリスクをもたらす。
本研究では,LLMをベースとしたエージェントのセキュリティを,オペレーティングシステムのレンズを通して調査する。
どちらも、リソースの分離、特権の分離、コミュニケーションの仲介において、著しく類似した課題に直面しています。
この観点から、我々はオープンソースのエージェントの現在の状況を調査し、統一されたエージェントアーキテクチャを導き、潜在的攻撃ベクトルを体系的に分析する。
この分析を検証するために,広く使用されている4つのOpenClaw-likeエージェントのケーススタディを行った。
攻撃能力に乏しい場合でも、いくつかの保護機構が実際に失敗し、セキュアな操作には詳細なシステム知識と注意深い設定が必要である。
しかし、いくつかのエージェント機能は設計上は安全ではないものの、多くの脆弱性はオペレーティングシステムのセキュリティから確立した技術を用いて軽減することができる。
エージェントシステムの安全な設計のための一連の勧告で締めくくります。
関連論文リスト
- OMNI-LEAK: Orchestrator Multi-Agent Network Induced Data Leakage [59.3826294523924]
オーケストレータ設定として知られる,一般的なマルチエージェントパターンのセキュリティ脆弱性について検討する。
本報告では,フロンティアモデルの攻撃カテゴリに対する感受性を報告し,推論モデルと非推論モデルの両方が脆弱であることが確認された。
論文 参考訳(メタデータ) (2026-02-13T21:32:32Z) - Just Ask: Curious Code Agents Reveal System Prompts in Frontier LLMs [65.6660735371212]
textbftextscJustAskは,インタラクションのみで効果的な抽出戦略を自律的に発見するフレームワークである。
これは、アッパー信頼境界に基づく戦略選択と、原子プローブと高レベルのオーケストレーションにまたがる階層的なスキル空間を用いて、オンライン探索問題として抽出を定式化する。
この結果から,現代のエージェントシステムにおいて,システムプロンプトは致命的ではあるがほぼ無防備な攻撃面であることがわかった。
論文 参考訳(メタデータ) (2026-01-29T03:53:25Z) - Towards Verifiably Safe Tool Use for LLM Agents [53.55621104327779]
大規模言語モデル(LLM)ベースのAIエージェントは、データソース、API、検索エンジン、コードサンドボックス、さらにはその他のエージェントなどのツールへのアクセスを可能にすることで、機能を拡張する。
LLMは意図しないツールインタラクションを起動し、機密データを漏洩したり、クリティカルレコードを上書きしたりするリスクを発生させる。
モデルベースセーフガードのようなリスクを軽減するための現在のアプローチは、エージェントの信頼性を高めるが、システムの安全性を保証することはできない。
論文 参考訳(メタデータ) (2026-01-12T21:31:38Z) - OS-Sentinel: Towards Safety-Enhanced Mobile GUI Agents via Hybrid Validation in Realistic Workflows [77.95511352806261]
VLM(Vision-Language Models)を利用したコンピュータ利用エージェントは、モバイルプラットフォームのようなデジタル環境を操作する上で、人間のような能力を実証している。
我々は,明示的なシステムレベルの違反を検出するための形式検証器と,文脈的リスクとエージェント行動を評価するコンテキスト判断器を組み合わせた,新しいハイブリッド安全検出フレームワークOS-Sentinelを提案する。
論文 参考訳(メタデータ) (2025-10-28T13:22:39Z) - SafeMobile: Chain-level Jailbreak Detection and Automated Evaluation for Multimodal Mobile Agents [58.21223208538351]
本研究は,モバイルマルチモーダルエージェントを取り巻くセキュリティ問題について考察する。
行動シーケンス情報を組み込んだリスク識別機構の構築を試みる。
また、大規模言語モデルに基づく自動アセスメントスキームも設計している。
論文 参考訳(メタデータ) (2025-07-01T15:10:00Z) - LLM Agents Should Employ Security Principles [60.03651084139836]
本稿では,大規模言語モデル(LLM)エージェントを大規模に展開する際には,情報セキュリティの確立した設計原則を採用するべきであることを論じる。
AgentSandboxは、エージェントのライフサイクル全体を通して保護を提供するために、これらのセキュリティ原則を組み込んだ概念的なフレームワークである。
論文 参考訳(メタデータ) (2025-05-29T21:39:08Z) - Safeguarding AI Agents: Developing and Analyzing Safety Architectures [0.0]
本稿では,人間チームと連携するAIシステムにおける安全対策の必要性について論じる。
我々は,AIエージェントシステムにおける安全プロトコルを強化する3つのフレームワークを提案し,評価する。
これらのフレームワークはAIエージェントシステムの安全性とセキュリティを大幅に強化することができると結論付けている。
論文 参考訳(メタデータ) (2024-09-03T10:14:51Z) - Mapping LLM Security Landscapes: A Comprehensive Stakeholder Risk Assessment Proposal [0.0]
本稿では,従来のシステムにおけるリスク評価手法のようなツールを用いたリスク評価プロセスを提案する。
我々は、潜在的な脅威要因を特定し、脆弱性要因に対して依存するシステムコンポーネントをマッピングするためのシナリオ分析を行う。
3つの主要株主グループに対する脅威もマップ化しています。
論文 参考訳(メタデータ) (2024-03-20T05:17:22Z) - Whispers in the Machine: Confidentiality in Agentic Systems [7.893457690926516]
エージェントシステムは、ほとんどのユーザインタラクションと外部ツールやサービスとの様々な統合のためのインターフェースとして、Large Language Models (LLM) を使用する。
操作された統合は内部のLCMを利用して、他のインターフェースを通してアクセスされた機密データを侵害することができる。
外部ツールの統合によるシステムへのLLMの統合は、確立されたプロンプトベースの攻撃と同じようなリスクをもたらすことを示す。
論文 参考訳(メタデータ) (2024-02-10T11:07:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。