論文の概要: A Large-Scale Evolvable Dataset for Model Context Protocol Ecosystem and Security Analysis
- arxiv url: http://arxiv.org/abs/2506.23474v1
- Date: Mon, 30 Jun 2025 02:37:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.898103
- Title: A Large-Scale Evolvable Dataset for Model Context Protocol Ecosystem and Security Analysis
- Title(参考訳): モデルコンテキストプロトコルエコシステムのための大規模進化可能データセットとセキュリティ分析
- Authors: Zhiwei Lin, Bonan Ruan, Jiahao Liu, Weibo Zhao,
- Abstract要約: 約14KのMPPサーバと300のMPPクライアントを含む大規模データセットであるMCPCorpusを紹介する。
各アーティファクトには、アイデンティティ、インターフェース設定、GitHubアクティビティ、メタデータをキャプチャする20以上の正規化された属性がアノテートされている。
MCPCorpusは、実世界のMCPエコシステムの再現可能なスナップショットを提供し、採用トレンド、エコシステムの健全性、実装の多様性の研究を可能にする。
- 参考スコア(独自算出の注目度): 8.943261888363622
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The Model Context Protocol (MCP) has recently emerged as a standardized interface for connecting language models with external tools and data. As the ecosystem rapidly expands, the lack of a structured, comprehensive view of existing MCP artifacts presents challenges for research. To bridge this gap, we introduce MCPCorpus, a large-scale dataset containing around 14K MCP servers and 300 MCP clients. Each artifact is annotated with 20+ normalized attributes capturing its identity, interface configuration, GitHub activity, and metadata. MCPCorpus provides a reproducible snapshot of the real-world MCP ecosystem, enabling studies of adoption trends, ecosystem health, and implementation diversity. To keep pace with the rapid evolution of the MCP ecosystem, we provide utility tools for automated data synchronization, normalization, and inspection. Furthermore, to support efficient exploration and exploitation, we release a lightweight web-based search interface. MCPCorpus is publicly available at: https://github.com/Snakinya/MCPCorpus.
- Abstract(参考訳): Model Context Protocol (MCP)は、最近、言語モデルと外部ツールとデータを接続するための標準化されたインターフェースとして登場した。
生態系が急速に拡大するにつれて、既存のMSPアーティファクトの構造化された総合的なビューが欠如していることが研究の課題となっている。
このギャップを埋めるために,約14KのMPPサーバと300のMPPクライアントを含む大規模データセットであるMCPCorpusを導入する。
各アーティファクトには、アイデンティティ、インターフェース設定、GitHubアクティビティ、メタデータをキャプチャする20以上の正規化された属性がアノテートされている。
MCPCorpusは、実世界のMCPエコシステムの再現可能なスナップショットを提供し、採用トレンド、エコシステムの健全性、実装の多様性の研究を可能にする。
MCPエコシステムの急速な進化に追従するため、自動データ同期、正規化、検査のためのユーティリティツールを提供しています。
さらに,効率的な探索とエクスプロイトを支援するために,軽量なWebベースの検索インタフェースをリリースする。
MCPCorpusはhttps://github.com/Snakinya/MCPCorpus.comで公開されている。
関連論文リスト
- Model Context Protocol (MCP) at First Glance: Studying the Security and Maintainability of MCP Servers [16.794115541448758]
Anthropicは2024年後半にこのツールエコシステムを標準化するためにModel Context Protocol (MCP)を導入した。
採用にもかかわらず、MPPのAI駆動の非決定論的制御フローは、持続可能性、セキュリティ、保守性に対する新たなリスクをもたらす。
我々は1,899のオープンソースMPPサーバを評価し,その健全性,セキュリティ,保守性を評価した。
論文 参考訳(メタデータ) (2025-06-16T14:26:37Z) - Mic-hackathon 2024: Hackathon on Machine Learning for Electron and Scanning Probe Microscopy [54.24356756795849]
顕微鏡は、ナノメートルと原子スケールにおける材料構造と機能に関する情報の主要な源である。
主要な資金機関によるデータ管理計画(DMP)の導入は、保存とアクセスを促進する。
標準化されたコードエコシステム、ベンチマーク、統合戦略が欠如しているため、洞察を得るのは難しいままです。
論文 参考訳(メタデータ) (2025-06-10T03:54:36Z) - Scalable Video-to-Dataset Generation for Cross-Platform Mobile Agents [57.59830804627066]
実世界のモバイルOSナビゲーションをキャプチャする20Kの指導ビデオから,313Kの注釈付きフレームの大規模データセットであるMONDAYを紹介した。
MONDAYを事前学習フェーズに含むモデルは、堅牢なクロスプラットフォームの一般化機能を示す。
公開されているビデオコンテンツを利用して、包括的なタスクデータセットを作成する自動化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T02:39:03Z) - Model Context Protocol (MCP): Landscape, Security Threats, and Future Research Directions [5.1875389249043415]
Model Context Protocol(MCP)は、AIモデルと外部ツールとリソースのシームレスな相互作用を可能にするために設計された標準化されたインターフェースである。
本稿では,MPP サーバのコアコンポーネント,ワークフロー,ライフサイクルに焦点をあてた総合的な MCP の概要について述べる。
我々は、各フェーズに関連するセキュリティとプライバシのリスクを分析し、潜在的な脅威を軽減するための戦略を提案する。
論文 参考訳(メタデータ) (2025-03-30T01:58:22Z) - Towards a Classification of Open-Source ML Models and Datasets for Software Engineering [52.257764273141184]
オープンソースの事前訓練モデル(PTM)とデータセットは、さまざまな機械学習(ML)タスクに広範なリソースを提供する。
これらのリソースには、ソフトウェア工学(SE)のニーズに合わせた分類がない。
我々は、人気のあるオープンソースのMLリポジトリであるHugging Face (HF)上で、SE指向の分類をPTMとデータセットに適用し、時間とともにPTMの進化を分析する。
論文 参考訳(メタデータ) (2024-11-14T18:52:05Z) - What Makes Good Collaborative Views? Contrastive Mutual Information Maximization for Multi-Agent Perception [52.41695608928129]
マルチエージェント認識(MAP)は、複数のソースからのデータを解釈することで、自律システムが複雑な環境を理解することを可能にする。
本稿では,MAPにおける協調的視点の「良い」特性を探求することに焦点を当てた中間的協調について検討する。
中間コラボレーションのための新しいフレームワークCMiMCを提案する。
論文 参考訳(メタデータ) (2024-03-15T07:18:55Z) - Integration of Domain Expert-Centric Ontology Design into the CRISP-DM for Cyber-Physical Production Systems [45.05372822216111]
機械学習(ML)とデータマイニング(DM)の手法は、収集されたデータから複雑で隠れたパターンを抽出する上で有望であることが証明されている。
しかし、このようなデータ駆動プロジェクトは、通常、CRISPDM(Cross-Industry Standard Process for Data Mining)で実行され、データの理解と準備に要する時間の不均等さのために失敗することが多い。
このコントリビューションは、データサイエンティストがCPPSの課題に対してより迅速かつ確実に洞察を得ることができるように、統合されたアプローチを提供することを目的としている。
論文 参考訳(メタデータ) (2023-07-21T15:04:00Z) - MLOps: A Step Forward to Enterprise Machine Learning [0.0]
この研究は、MLOps、そのメリット、困難、進化、および重要な基盤技術に関する詳細なレビューを提示する。
MLOpsワークフローは、モデルとデータ探索とデプロイメントの両方に必要なさまざまなツールとともに、詳細に説明されている。
この記事では、さまざまな成熟度の高い自動パイプラインを使用して、MLプロジェクトのエンドツーエンド生産にも光を当てます。
論文 参考訳(メタデータ) (2023-05-27T20:44:14Z) - KG-Hub -- Building and Exchanging Biological Knowledge Graphs [0.5369297590461578]
KG-Hubは知識グラフの標準化された構築、交換、再利用を可能にするプラットフォームである。
現在のKG-Hubプロジェクトは、新型コロナウイルス研究、薬物再精製、微生物-環境相互作用、希少疾患研究などのユースケースにまたがっている。
論文 参考訳(メタデータ) (2023-01-31T21:29:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。