Fugu-MT 論文翻訳(概要): A Formal Security Framework for MCP-Based AI Agents: Threat Taxonomy, Verification Models, and Defense Mechanisms

論文の概要: A Formal Security Framework for MCP-Based AI Agents: Threat Taxonomy, Verification Models, and Defense Mechanisms

arxiv url: http://arxiv.org/abs/2604.05969v1
Date: Tue, 07 Apr 2026 15:02:47 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-08 17:42:09.901689
Title: A Formal Security Framework for MCP-Based AI Agents: Threat Taxonomy, Verification Models, and Defense Mechanisms
Title（参考訳）: MCPベースのAIエージェントのための形式的セキュリティフレームワーク:脅威分類学、検証モデル、防御メカニズム
Authors: Nirajan Acharya, Gaurav Kumar Gupta,
Abstract要約: Model Context Protocol (MCP) は、大規模言語モデル(LLM)ベースのエージェントを外部ツールやデータソースに接続するためのデファクトスタンダードとなっている。本稿では,MPPベースのAIエージェントのための総合的なセキュリティフレームワークであるMPPSHIELDを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The Model Context Protocol (MCP), introduced by Anthropic in November 2024 and now governed by the Linux Foundation's Agentic AI Foundation, has rapidly become the de facto standard for connecting large language model (LLM)-based agents to external tools and data sources, with over 97 million monthly SDK downloads and more than 177000 registered tools. However, this explosive adoption has exposed a critical gap: the absence of a unified, formal security framework capable of systematically characterizing, analyzing, and mitigating the diverse threats facing MCP-based agent ecosystems. Existing security research remains fragmented across individual attack papers, isolated benchmarks, and point defense mechanisms. This paper presents MCPSHIELD, a comprehensive formal security framework for MCP-based AI agents. We make four principal contributions: (1) a hierarchical threat taxonomy comprising 7 threat categories and 23 distinct attack vectors organized across four attack surfaces, grounded in the analysis of over 177000 MCP tools; (2) a formal verification model based on labeled transition systems with trust boundary annotations that enables static and runtime analysis of MCP tool interaction chains; (3) a systematic comparative evaluation of 12 existing defense mechanisms, identifying coverage gaps across our threat taxonomy; and (4) a defense in depth reference architecture integrating capability based access control, cryptographic tool attestation, information flow tracking, and runtime policy enforcement. Our analysis reveals that no existing single defense covers more than 34 percent of the identified threat landscape, whereas MCPSHIELD's integrated architecture achieves theoretical coverage of 91 percent. We further identify seven open research challenges that must be addressed to secure the next generation of agentic AI systems.
Abstract（参考訳）: 2024年11月にAnthropicが導入し、現在はLinux FoundationのAgentic AI Foundationが管理しているModel Context Protocol(MCP)は、大規模言語モデル(LLM)ベースのエージェントを外部ツールやデータソースに接続するためのデファクトスタンダードとなり、9700万以上の月間SDKダウンロードと177000以上の登録ツールが提供されている。しかし、この爆発的な採用は、MSPベースのエージェントエコシステムが直面する多様な脅威を体系的に特徴づけ、分析し、緩和する、統一的で正式なセキュリティフレームワークが存在しないという重大なギャップを露呈している。既存のセキュリティ研究は、個々の攻撃文書、独立したベンチマーク、ポイント防御メカニズムで断片化されている。本稿では,MPPベースのAIエージェントのための総合的なセキュリティフレームワークであるMPPSHIELDを提案する。本研究は,(1)脅威カテゴリ7種,23種の攻撃ベクトルからなる階層的脅威分類,(2)MCPツールの静的および実行時解析が可能な信頼境界アノテーションを持つラベル付きトランジションシステムに基づく形式的検証モデル,(3)既存の12の防御機構の体系的比較評価,脅威分類間のカバーギャップの識別,(4)アクセス制御,暗号ツールの検証,情報フロー追跡,実行時ポリシーの実施を基盤とした深度参照アーキテクチャの防衛。 MCPSHIELDの統合アーキテクチャは理論的なカバレッジ91%を達成しているのに対し、既存の単一防御は識別された脅威のランドスケープの34%以上をカバーしていない。我々は、次世代のエージェントAIシステムを確保するために対処しなければならない7つのオープンな研究課題をさらに特定する。

関連論文リスト

Your Agent, Their Asset: A Real-World Safety Analysis of OpenClaw [87.97230960702274]
本稿では,OpenClawの安全性評価について紹介する。エージェントの永続状態を3次元に統一するCIK分類法を導入する。評価では、ライブOpenClawインスタンス上の12のアタックシナリオをカバーしています。
論文参考訳（メタデータ） (2026-04-06T15:27:05Z)
Security Considerations for Multi-agent Systems [4.004329206052807]
マルチエージェント人工知能システム(英: Multi-agent AI system、MAS)は、エージェント間のコミュニケーションを通じて、委任されたツール権限を行使し、永続的なメモリを共有し、コーディネートする自律エージェントのシステムである。本研究は、MASの脅威景観を体系的に特徴づけ、それに対するAIのための16のセキュリティフレームワークを定量的に評価する。
論文参考訳（メタデータ） (2026-03-09T22:46:27Z)
OMNI-LEAK: Orchestrator Multi-Agent Network Induced Data Leakage [59.3826294523924]
オーケストレータ設定として知られる,一般的なマルチエージェントパターンのセキュリティ脆弱性について検討する。本報告では,フロンティアモデルの攻撃カテゴリに対する感受性を報告し,推論モデルと非推論モデルの両方が脆弱であることが確認された。
論文参考訳（メタデータ） (2026-02-13T21:32:32Z)
Prompt Injection Attacks on Agentic Coding Assistants: A Systematic Analysis of Vulnerabilities in Skills, Tools, and Protocol Ecosystems [0.0]
本稿では,エージェント・コーディング・アシスタントを対象としたインジェクション・アタックの包括的解析を行う。メタアナリシスは78の最近の研究から得られた知見を合成する。以上の結果から,セキュリティコミュニティはプロンプトインジェクションを第一級脆弱性クラスとして扱う必要があることが示唆された。
論文参考訳（メタデータ） (2026-01-24T18:39:21Z)
An Empirical Study on the Security Vulnerabilities of GPTs [48.12756684275687]
GPTは、OpenAIの大規模言語モデルに基づいた、カスタマイズされたAIエージェントの一種である。本稿では,GPTのセキュリティ脆弱性に関する実証的研究について述べる。
論文参考訳（メタデータ） (2025-11-28T13:30:25Z)
Securing AI Agents Against Prompt Injection Attacks [0.0]
本稿では,RAG対応AIエージェントのインジェクションリスク評価のためのベンチマークを提案する。本フレームワークは,攻撃速度を73.2%から8.7%に削減し,94.3%のベースラインタスク性能を維持した。
論文参考訳（メタデータ） (2025-11-19T10:00:54Z)
A Systematic Survey of Model Extraction Attacks and Defenses: State-of-the-Art and Perspectives [65.3369988566853]
近年の研究では、敵が対象モデルの機能を複製できることが示されている。モデル抽出攻撃は知的財産権、プライバシー、システムのセキュリティに脅威をもたらす。本稿では,攻撃機構,防衛手法,計算環境に応じてMEAを分類する新しい分類法を提案する。
論文参考訳（メタデータ） (2025-08-20T19:49:59Z)
Systematic Analysis of MCP Security [13.801464032236481]
Model Context Protocol(MCP)は、AIエージェントが外部ツールとシームレスに接続できるようにする普遍的な標準として登場した。 MCPはツール・ポジティング・アタック(TPA)のような重大な脆弱性を導入している。 MCPアタックライブラリ (MCPLIB) は, 4つの主要な分類の下で31の異なる攻撃手法を分類・実装する。
論文参考訳（メタデータ） (2025-08-18T00:23:41Z)
Security Challenges in AI Agent Deployment: Insights from a Large Scale Public Competition [101.86739402748995]
44の現実的なデプロイメントシナリオを対象とした,22のフロンティアAIエージェントを対象にしています。 Agent Red Teamingベンチマークを構築し、19の最先端モデルで評価します。私たちの発見は、今日のAIエージェントの重要かつ永続的な脆弱性を浮き彫りにしたものです。
論文参考訳（メタデータ） (2025-07-28T05:13:04Z)
Bridging AI and Software Security: A Comparative Vulnerability Assessment of LLM Agent Deployment Paradigms [1.03121181235382]
大規模言語モデル(LLM)エージェントは、AI固有の旧来のソフトウェアドメインにまたがるセキュリティ上の脆弱性に直面している。本研究では,Function Calling アーキテクチャと Model Context Protocol (MCP) デプロイメントパラダイムの比較評価を通じて,このギャップを埋める。私たちは7つの言語モデルにわたる3,250の攻撃シナリオをテストし、AI固有の脅威とソフトウェア脆弱性の両方を対象として、シンプルで、構成され、連鎖した攻撃を評価しました。
論文参考訳（メタデータ） (2025-07-08T18:24:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。