論文の概要: MCPZoo: A Large-Scale Dataset of Runnable Model Context Protocol Servers for AI Agent
- arxiv url: http://arxiv.org/abs/2512.15144v1
- Date: Wed, 17 Dec 2025 07:13:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.885043
- Title: MCPZoo: A Large-Scale Dataset of Runnable Model Context Protocol Servers for AI Agent
- Title(参考訳): MCPZoo: AIエージェントのための実行可能なモデルコンテキストプロトコルサーバの大規模データセット
- Authors: Mengying Wu, Pei Chen, Geng Hong, Aichao An, Jinsong Chen, Binwang Wan, Xudong Pan, Jiarun Dai, Min Yang,
- Abstract要約: Model Context Protocol (MCP) はエージェントが外部ツールと対話することを可能にするが、MCPに関する実証的研究は大規模でアクセス可能なデータセットの欠如によって妨げられている。
MCPZooは、90,146サーバからなる複数のパブリックソースから収集された、最大かつ最も包括的なMSPサーバのデータセットである。
- 参考スコア(独自算出の注目度): 21.609308232244118
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Model Context Protocol (MCP) enables agents to interact with external tools, yet empirical research on MCP is hindered by the lack of large-scale, accessible datasets. We present MCPZoo, the largest and most comprehensive dataset of MCP servers collected from multiple public sources, comprising 90,146 servers. MCPZoo includes over ten thousand server instances that have been deployed and verified as runnable and interactable, supporting realistic experimentation beyond static analysis. The dataset provides unified metadata and access interfaces, enabling systematic exploration and interaction without manual deployment effort. MCPZoo is released as an open and accessible resource to support research on MCP-based security analysis.
- Abstract(参考訳): Model Context Protocol (MCP) はエージェントが外部ツールと対話することを可能にするが、MCPに関する実証的研究は大規模でアクセス可能なデータセットの欠如によって妨げられている。
MCPZooは、90,146サーバからなる複数のパブリックソースから収集された、最大かつ最も包括的なMSPサーバのデータセットである。
MCPZooには1万以上のサーバインスタンスが含まれており、実行可能で対話性があり、静的解析以上の現実的な実験をサポートする。
データセットはメタデータとアクセスインターフェースを統一し、手動によるデプロイメント作業なしに体系的な探索とインタラクションを可能にする。
MCPZooは、MPPベースのセキュリティ分析の研究を支援するオープンでアクセス可能なリソースとしてリリースされた。
関連論文リスト
- MCP-Flow: Facilitating LLM Agents to Master Real-World, Diverse and Scaling MCP Tools [58.5971352939562]
大規模言語モデルは、複雑で現実的なタスクを実行するために、ますます外部ツールに依存しています。
既存のMSPリサーチは、少数のサーバーをカバーし、コストのかかる手作業によるキュレーションに依存し、トレーニングサポートが欠如している。
我々は大規模なサーバ発見、データ合成、モデルトレーニングのための自動Webエージェント駆動パイプラインであるMPP-Flowを紹介した。
論文 参考訳(メタデータ) (2025-10-28T10:42:17Z) - Securing AI Agent Execution [5.599792629509229]
我々は,MPPサーバ用のアクセス制御フレームワークであるAgentBoundを紹介する。
296のMSPサーバを含むデータセットを構築し、80.9%の精度でソースコードからアクセス制御ポリシーを自動生成できることを示します。
また、AgentBoundは悪意のあるMSPサーバのセキュリティ脅威の大部分をブロックし、ポリシー執行エンジンが無視可能なオーバーヘッドを発生させることを示した。
論文 参考訳(メタデータ) (2025-10-24T08:10:36Z) - MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers [86.00932417210477]
MCP-Universeは,実世界のMPPサーバとのインタラクションを通じて,現実的かつ困難なタスクにおいてLLMを評価するために設計された,初めての総合ベンチマークである。
私たちのベンチマークでは、ロケーションナビゲーション、リポジトリ管理、財務分析、3Dデザイン、ブラウザ自動化、Web検索という、11の異なるMSPサーバにまたがる6つのコアドメインを網羅しています。
GPT-5 (43.72%) やGrok-4 (33.33%) やClaude-4.0-Sonnet (29.44%) のようなSOTAモデルでさえ、大幅な性能制限がある。
論文 参考訳(メタデータ) (2025-08-20T13:28:58Z) - LiveMCPBench: Can Agents Navigate an Ocean of MCP Tools? [50.60770039016318]
モデルコンテキストプロトコル(MCP)エージェントをベンチマークする最初の総合ベンチマークであるLiveMCPBenchを紹介する。
LiveMCPBenchは、MPPエコシステムに根ざした95の現実世界のタスクで構成されている。
評価は10の先行モデルを対象としており、最高の性能のモデルが78.95%の成功率に達した。
論文 参考訳(メタデータ) (2025-08-03T14:36:42Z) - MCPEval: Automatic MCP-based Deep Evaluation for AI Agent Models [76.72220653705679]
我々は、エンドツーエンドタスク生成とインテリジェントエージェントの深い評価を自動化するオープンソースのフレームワークであるMCPEvalを紹介する。
MCPEvalはメトリクスを標準化し、ネイティブエージェントツールとシームレスに統合し、評価パイプラインを構築するための手作業を排除する。
実世界の5つのドメインにまたがる実証的な結果から、ニュアンスのある、ドメイン固有のパフォーマンスを明らかにする効果が示された。
論文 参考訳(メタデータ) (2025-07-17T05:46:27Z) - A Large-Scale Evolvable Dataset for Model Context Protocol Ecosystem and Security Analysis [8.943261888363622]
約14KのMPPサーバと300のMPPクライアントを含む大規模データセットであるMCPCorpusを紹介する。
各アーティファクトには、アイデンティティ、インターフェース設定、GitHubアクティビティ、メタデータをキャプチャする20以上の正規化された属性がアノテートされている。
MCPCorpusは、実世界のMCPエコシステムの再現可能なスナップショットを提供し、採用トレンド、エコシステムの健全性、実装の多様性の研究を可能にする。
論文 参考訳(メタデータ) (2025-06-30T02:37:27Z) - MCP Safety Audit: LLMs with the Model Context Protocol Allow Major Security Exploits [0.0]
Model Context Protocol (MCP) は、大規模言語モデル(LLM)、データソース、エージェントツールへのAPI呼び出しを標準化するオープンプロトコルである。
現在のMPP設計はエンドユーザーに幅広いセキュリティリスクをもたらすことを示す。
任意のMPPサーバのセキュリティを評価するために,安全監査ツールであるMPPSafetyScannerを導入する。
論文 参考訳(メタデータ) (2025-04-02T21:46:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。