論文の概要: From Stateless Queries to Autonomous Actions: A Layered Security Framework for Agentic AI Systems
- arxiv url: http://arxiv.org/abs/2604.23338v1
- Date: Sat, 25 Apr 2026 14:57:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.279132
- Title: From Stateless Queries to Autonomous Actions: A Layered Security Framework for Agentic AI Systems
- Title(参考訳): ステートレスクエリから自律アクションへ - エージェントAIシステムのための階層型セキュリティフレームワーク
- Authors: Kexin Chu,
- Abstract要約: エージェントAIシステムは、拡張された水平線を越えて計画し、永続的なメモリを維持し、外部ツールを起動し、ピアエージェントと調整する。
既存のセキュリティ分析は、攻撃タイプ(プロンプトインジェクション、ジェイルブレイク)によって脅威を整理するが、アーキテクチャコンポーネントが脆弱な原則モデルを提供しない。
脅威を異なるアーキテクチャコンポーネントにマッピングする7層フレームワークであるLayered Attack Surface Model (LASM)を紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agentic AI systems face security challenges that stateless large language models do not. They plan across extended horizons, maintain persistent memory, invoke external tools, and coordinate with peer agents. Existing security analyses organize threats by attack type (prompt injection, jailbreaking), but provide no principled model of which architectural component is vulnerable or over what timescale the threat manifests. This paper makes five contributions. First, we introduce the Layered Attack Surface Model (LASM), a seven-layer framework that maps threats to distinct architectural components: Foundation, Cognitive, Memory, Tool Execution, Multi-Agent Coordination, Ecosystem, and Governance, the accountability and observability layer that spans the stack analogously to the network management plane. Second, we introduce attack temporality as an orthogonal analytical dimension with four classes: Instantaneous (T1), Session-Persistent (T2), Cross-Session Cumulative (T3), and Sub-Session-Stack, Non-Session-Bounded (T4). Third, through a systematic review of 94 papers (2021--2025), we show that the most dangerous emerging threats concentrate at the intersection of high-layer attacks (L5--L7) and slow-burn temporality (T3--T4): covert agent collusion, long-term memory poisoning, MCP supply-chain compromise, and alignment failure that manifests as an insider threat with no external adversary. Only 8 of 120 paper-cell assignments (7%) fall in this zone. Fourth, we propose a cross-layer defense taxonomy spanning all seven LASM layers and all four temporality classes, exposing which threat classes existing defenses leave unaddressed. Fifth, we survey evaluation benchmarks, identify five research gaps in the under-studied high-layer, slow-burn zone, and argue that agentic security must be treated as a distributed systems problem embedded in an adversarial ecosystem.
- Abstract(参考訳): エージェントAIシステムは、ステートレスな大規模言語モデルではできないセキュリティ上の課題に直面します。
彼らは拡張された水平線をまたいで計画し、永続的なメモリを維持し、外部ツールを呼び出し、ピアエージェントと協調する。
既存のセキュリティ分析では、アタックタイプ(プロンプトインジェクション、ジェイルブレイク)によって脅威を整理するが、アーキテクチャコンポーネントが脆弱であるか、あるいは脅威がどのような時間スケールで現れるかという原則的なモデルを提供しない。
この論文は5つの貢献をする。
まず、脅威を異なるアーキテクチャコンポーネントにマッピングする7層フレームワークであるLayered Attack Surface Model (LASM)を紹介します。
Instantaneous (T1), Session-Persistent (T2), Cross-Session Cumulative (T3), Sub-Session-Stack, Non-Session-Bounded (T4) の4つのクラスからなる直交的分析次元として攻撃時相を導入する。
第3に,94の論文(2021-2025)を体系的にレビューした結果,最も危険な新興脅威は高層攻撃(L5-L7)と低燃焼時間(T3-T4)の交差点に集中していることが判明した。
120のペーパーセル割り当てのうち、わずか8つ(7%)がこのゾーンに該当する。
第4に,7つのLASM層と4つの時間性クラスにまたがる多層防衛分類を提案する。
第5に、評価ベンチマークを調査し、調査対象の低層、低バーンゾーンの5つの研究ギャップを特定し、エージェントセキュリティは、敵のエコシステムに埋め込まれた分散システム問題として扱う必要があると論じる。
関連論文リスト
- SafeHarness: Lifecycle-Integrated Security Architecture for LLM-based Agent Deployment [19.947119280467934]
セーフハーネス(Safeharness)は、4つの防衛レイヤがエージェントライフサイクルに直接織られるセキュリティアーキテクチャである。
ベンチマークデータセットの安全性を、多様なハーネス構成で評価する。
論文 参考訳(メタデータ) (2026-04-15T08:59:00Z) - A Formal Security Framework for MCP-Based AI Agents: Threat Taxonomy, Verification Models, and Defense Mechanisms [0.0]
Model Context Protocol (MCP) は、大規模言語モデル(LLM)ベースのエージェントを外部ツールやデータソースに接続するためのデファクトスタンダードとなっている。
本稿では,MPPベースのAIエージェントのための総合的なセキュリティフレームワークであるMPPSHIELDを提案する。
論文 参考訳(メタデータ) (2026-04-07T15:02:47Z) - Your Agent, Their Asset: A Real-World Safety Analysis of OpenClaw [87.97230960702274]
本稿では,OpenClawの安全性評価について紹介する。
エージェントの永続状態を3次元に統一するCIK分類法を導入する。
評価では、ライブOpenClawインスタンス上の12のアタックシナリオをカバーしています。
論文 参考訳(メタデータ) (2026-04-06T15:27:05Z) - Your Agent is More Brittle Than You Think: Uncovering Indirect Injection Vulnerabilities in Agentic LLMs [32.38053469964495]
システム間インタラクションを含む拡張されたアクションスペースは、深刻なセキュリティ上の問題を引き起こす。
悪意のある命令をサードパーティのコンテンツ内に隠蔽するIPIは、データ流出などの不正なアクションをトリガーする。
9個のLPMバックボーンにまたがる4つの高度なIPI攻撃ベクトルに対する6つの防御戦略を評価した。
論文 参考訳(メタデータ) (2026-04-04T21:27:04Z) - Poisoning the Pixels: Revisiting Backdoor Attacks on Semantic Segmentation [28.208102468217394]
本研究は,セマンティックセグメンテーションに適したバックドア攻撃を系統的に検討する。
本稿では、トリガ設計を最適化し、ラベル操作戦略を適用して攻撃性能を最大化する統合フレームワークBADSEGを紹介する。
我々の研究は、セマンティックセグメンテーションにおけるこれまで見過ごされていたセキュリティの脆弱性を明らかにし、セグメンテーション固有の脅威モデルに合わせたディフェンスの開発を動機付けている。
論文 参考訳(メタデータ) (2026-03-17T11:42:17Z) - Just Ask: Curious Code Agents Reveal System Prompts in Frontier LLMs [65.6660735371212]
textbftextscJustAskは,インタラクションのみで効果的な抽出戦略を自律的に発見するフレームワークである。
これは、アッパー信頼境界に基づく戦略選択と、原子プローブと高レベルのオーケストレーションにまたがる階層的なスキル空間を用いて、オンライン探索問題として抽出を定式化する。
この結果から,現代のエージェントシステムにおいて,システムプロンプトは致命的ではあるがほぼ無防備な攻撃面であることがわかった。
論文 参考訳(メタデータ) (2026-01-29T03:53:25Z) - BackdoorAgent: A Unified Framework for Backdoor Attacks on LLM-based Agents [58.83028403414688]
大規模言語モデル(LLM)エージェントは、計画、メモリ、ツールの使用を組み合わせた多段階ワークフローを通じてタスクを実行する。
エージェントワークフローの特定のステージに注入されたバックドアトリガーは、複数の中間状態を通して持続し、下流出力に悪影響を及ぼす可能性がある。
LLMエージェントにおけるバックドア脅威を統一したエージェント中心のビューを提供するモジュールおよびステージアウェアフレームワークである textbfBackdoorAgent を提案する。
論文 参考訳(メタデータ) (2026-01-08T03:49:39Z) - QSAF: A Novel Mitigation Framework for Cognitive Degradation in Agentic AI [2.505520948667288]
エージェントAIシステムにおける新たな脆弱性クラスとして認知劣化を導入する。
これらの障害は、メモリの飢餓、プランナーの再帰、コンテキストの洪水、出力の抑制によって内部的に発生する。
この種の障害に対処するため、我々はQorvex Security AI Framework for Behavioral & Cognitive Resilienceを紹介します。
論文 参考訳(メタデータ) (2025-07-21T07:41:58Z) - An LLM-based Self-Evolving Security Framework for 6G Space-Air-Ground Integrated Networks [49.605335601285496]
6Gスペースエアグラウンド統合ネットワーク(SAGIN)は、様々なモバイルアプリケーションに対してユビキタスなカバレッジを提供する。
大規模言語モデル(LLM)に基づくSAGINの新しいセキュリティフレームワークを提案する。
当社のフレームワークは,さまざまな未知の攻撃に対して堅牢な,高精度なセキュリティ戦略を実現しています。
論文 参考訳(メタデータ) (2025-05-06T04:14:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。