論文の概要: Real Faults in Model Context Protocol (MCP) Software: a Comprehensive Taxonomy
- arxiv url: http://arxiv.org/abs/2603.05637v1
- Date: Thu, 05 Mar 2026 19:47:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:44.469884
- Title: Real Faults in Model Context Protocol (MCP) Software: a Comprehensive Taxonomy
- Title(参考訳): モデルコンテキストプロトコル(MCP)ソフトウェアにおける実故障 : 包括的分類法
- Authors: Mina Taraghi, Mohammad Mehdi Morovati, Foutse Khomh,
- Abstract要約: 本稿では,Model Context Protocol ベースのソフトウェアシステムにおける障害の大規模分類について紹介する。
これらの洞察は、より堅牢で信頼性があり、セキュアなAI対応ソフトウェアシステムの開発に役立てることができる。
- 参考スコア(独自算出の注目度): 5.6795075579540395
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid adoption of foundation models has significantly expanded the capabilities of software systems, enabling them to perform complex language, reasoning, and interaction tasks that were previously difficult to automate. However, this progress has also introduced novel challenges that were largely absent in previous generations of software. In particular, the increasing integration of foundation models with external tools and resources raises new concerns regarding reliability, security, and robustness. The Model Context Protocol (MCP) has recently been proposed to standardize interactions between AI-based software systems, software tools, and external resources. Despite its growing adoption, there remains limited systematic understanding of real-world faults in MCP-based software systems. In this paper, we present the first large-scale taxonomy of faults in MCP servers, comprising five high-level fault categories derived from empirical evidence. To evaluate the completeness and generalizability of this taxonomy, we conduct a survey of MCP practitioners with diverse roles and experience levels. The results confirm that all identified fault categories occur in practice and reveal distinct characteristics that differentiate MCP-specific faults from non-MCP faults. Overall, this study provides actionable insights for researchers and practitioners by identifying the most error-prone and critical components of MCP-based systems. These insights can inform the development of more robust, reliable, and secure AI-enabled software systems that rely on MCP.
- Abstract(参考訳): ファウンデーションモデルが急速に採用され、ソフトウェアシステムの能力が大幅に拡張され、これまで自動化が困難だった複雑な言語、推論、インタラクションタスクが実行できるようになった。
しかし、この進歩は、以前の世代のソフトウェアにほとんど欠落していた新しい課題ももたらした。
特に、外部ツールやリソースとのファンデーションモデルの統合の増加は、信頼性、セキュリティ、堅牢性に関する新たな懸念を提起します。
モデルコンテキストプロトコル(MCP)は、AIベースのソフトウェアシステム、ソフトウェアツール、および外部リソース間のインタラクションを標準化するために最近提案されている。
採用が増加しているにもかかわらず、MPPベースのソフトウェアシステムには、現実世界の欠陥についての体系的な理解が限られている。
本稿では,経験的証拠から派生した5つの高レベル断層分類群からなるMPPサーバにおける断層の大規模分類について述べる。
本分類の完全性と一般化性を評価するため,多様な役割と経験レベルを有するMPP実践者を対象に調査を行った。
その結果,確認されたすべての断層カテゴリが実際に発生し,MCP固有の断層と非MCP断層とを区別する特徴を明らかにした。
本研究は,MCPベースのシステムにおいて,最もエラーを起こしやすい重要なコンポーネントを同定することによって,研究者や実践者に実用的な知見を提供する。
これらの洞察は、MPPに依存したより堅牢で信頼性があり、セキュアなAI対応ソフトウェアシステムの開発に役立てることができる。
関連論文リスト
- Don't believe everything you read: Understanding and Measuring MCP Behavior under Misleading Tool Descriptions [20.772501129444993]
本研究では,外部から提示されたツール記述と実装のミスマッチが,知的エージェントの精神モデルと意思決定行動をどのように形成するかを検討する。
その結果、ほとんどのサーバは高度に一貫性があるが、約13%のサーバは、文書化されていない特権操作、隠された状態の突然変異、または不正な金融行動を可能にする相当なミスマッチを示すことがわかった。
以上の結果から,記述符号の不整合性はMPPベースのAIエージェントにおいて具体的かつ一般的な攻撃面であり,今後のエージェントエコシステムにおいて,体系的な監査とより強力な透明性の保証の必要性が示唆された。
論文 参考訳(メタデータ) (2026-02-03T14:31:52Z) - Agentic Software Issue Resolution with Large Language Models: A Survey [9.583478737157531]
ソフトウェア問題解決は,ユーザが提供する自然言語記述に基づいて,ソフトウェアリポジトリの現実的な問題に対処することを目的としている。
推論と生成能力の大規模言語モデル(LLM)は、自動ソフトウェア問題解決において大きな進歩をもたらした。
近年,LSMベースのエージェントシステムがソフトウェア問題解決の主流となっている。
論文 参考訳(メタデータ) (2025-12-24T08:05:10Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - A Defect Classification Framework for AI-Based Software Systems (AI-ODC) [0.0]
本稿では,Orthogonal Defect Classification(ODC)パラダイムにヒントを得たフレームワークを提案する。
このフレームワークは、AIシステムのデータ、学習、思考の側面に対応するように適応された。
論文 参考訳(メタデータ) (2025-08-25T11:15:31Z) - MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers [86.00932417210477]
MCP-Universeは,実世界のMPPサーバとのインタラクションを通じて,現実的かつ困難なタスクにおいてLLMを評価するために設計された,初めての総合ベンチマークである。
私たちのベンチマークでは、ロケーションナビゲーション、リポジトリ管理、財務分析、3Dデザイン、ブラウザ自動化、Web検索という、11の異なるMSPサーバにまたがる6つのコアドメインを網羅しています。
GPT-5 (43.72%) やGrok-4 (33.33%) やClaude-4.0-Sonnet (29.44%) のようなSOTAモデルでさえ、大幅な性能制限がある。
論文 参考訳(メタデータ) (2025-08-20T13:28:58Z) - We Urgently Need Privilege Management in MCP: A Measurement of API Usage in MCP Ecosystems [28.59170303701817]
モデルコンテキストプロトコルのセキュリティリスクに関する大規模な実証分析を行った。
我々は23の機能カテゴリにまたがる2,562の実世界のMPPアプリケーションについて検討した。
MCP リソースアクセスの詳細な分類法を提案し,セキュリティ関連 API の利用状況を定量化し,より安全な MCP エコシステムを構築する上でのオープンな課題を明らかにする。
論文 参考訳(メタデータ) (2025-07-05T03:39:30Z) - Survey of LLM Agent Communication with MCP: A Software Design Pattern Centric Review [0.9208007322096533]
調査ではMediator, Observer, Publish-Subscribe, Brokerなど,確立したパターンを再検討している。
記事は、オープンな課題、潜在的なセキュリティリスク、堅牢で相互運用可能でスケーラブルなマルチエージェントエコシステムを前進させる有望な方向性を概説することで締めくくっている。
論文 参考訳(メタデータ) (2025-05-26T09:11:17Z) - Towards Human-Guided, Data-Centric LLM Co-Pilots [53.35493881390917]
CliMB-DCは、機械学習コパイロットのための、ヒューマンガイド付き、データ中心のフレームワークである。
高度なデータ中心ツールとLLM駆動推論を組み合わせることで、堅牢でコンテキスト対応のデータ処理を可能にする。
CliMB-DCが未処理のデータセットをML対応フォーマットに変換する方法を示す。
論文 参考訳(メタデータ) (2025-01-17T17:51:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。