論文の概要: Making REST APIs Agent-Ready: From OpenAPI to Model Context Protocol Servers for Tool-Augmented LLMs
- arxiv url: http://arxiv.org/abs/2507.16044v2
- Date: Wed, 23 Jul 2025 16:37:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 14:06:49.697782
- Title: Making REST APIs Agent-Ready: From OpenAPI to Model Context Protocol Servers for Tool-Augmented LLMs
- Title(参考訳): REST API Agent-Readyを作る: ツール拡張 LLM のための OpenAPI から Model Context Protocol Server へ
- Authors: Meriem Mastouri, Emna Ksontini, Wael Kessentini,
- Abstract要約: OpenAPI 2.0/3.0仕様からMPPサーバを生成するコンパイラであるAutoMCPを提案する。
10以上のドメインにまたがる5,066のエンドポイントにまたがる50の現実世界API上でAutoMCPを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are evolving from passive text generators into active agents that invoke external tools. To support this shift, scalable protocols for tool integration are essential. The Model Context Protocol (MCP), introduced by Anthropic in 2024, offers a schema-driven standard for dynamic tool discovery and invocation. Yet, building MCP servers remains manual and repetitive, requiring developers to write glue code, handle authentication, and configure schemas by hand-replicating much of the integration effort MCP aims to eliminate. This paper investigates whether MCP server construction can be meaningfully automated. We begin by analyzing adoption trends: among 22,000+ MCP-tagged GitHub repositories created within six months of release, fewer than 5% include servers, typically small, single-maintainer projects dominated by repetitive scaffolding. To address this gap, we present AutoMCP, a compiler that generates MCP servers from OpenAPI 2.0/3.0 specifications. AutoMCP parses REST API definitions and produces complete server implementations, including schema registration and authentication handling. We evaluate AutoMCP on 50 real-world APIs spanning 5,066 endpoints across over 10 domains. From a stratified sample of 1,023 tool calls, 76.5% succeeded out of the box. Manual failure analysis revealed five recurring issues, all attributable to inconsistencies or omissions in the OpenAPI contracts. After minor fixes, averaging 19 lines of spec changes per API, AutoMCP achieved 99.9% success. Our findings (i) analyze MCP adoption and quantify the cost of manual server development, (ii) demonstrate that OpenAPI specifications, despite quality issues, enable near-complete MCP server automation, and (iii) contribute a corpus of 5,066 callable tools along with insights on repairing common specification flaws.
- Abstract(参考訳): 大規模言語モデル(LLM)は、受動的テキストジェネレータから外部ツールを呼び出すアクティブエージェントへと進化している。
このシフトをサポートするためには、ツール統合のためのスケーラブルなプロトコルが不可欠だ。
モデルコンテキストプロトコル(MCP)は、2024年にAnthropicによって導入されたもので、動的ツールの発見と実行のためのスキーマ駆動の標準を提供する。
しかし、MSPサーバの構築は手動で反復的であり、開発者はMSPが目指す統合作業の多くを手作業で再現することで、グルーコードを書き、認証を処理し、スキーマを設定する必要がある。
本稿では,MPPサーバ構築が有意義に自動化できるかどうかを検討する。
リリースから6ヶ月以内に作成された22,000以上のMPPタグ付きGitHubリポジトリの中で、5%未満はサーバを含んでいない。
このギャップに対処するため,OpenAPI 2.0/3.0仕様からMPPサーバを生成するコンパイラであるAutoMCPを提案する。
AutoMCPはREST API定義を解析し、スキーマ登録や認証処理を含む完全なサーバ実装を生成する。
10以上のドメインにまたがる5,066のエンドポイントにまたがる50の現実世界API上でAutoMCPを評価する。
1,023のツールコールの成層的なサンプルから、76.5%がボックスから成功した。
手動の障害分析では、OpenAPI契約の不整合や省略に起因する5つの繰り返しの問題が明らかになった。
マイナーな修正を経て、APIごとの平均19行の仕様変更が行われ、AutoMCPは99.9%の成功を収めた。
私たちの発見
i)MPP導入の分析と手動サーバ開発コストの定量化。
(ii) 品質問題にもかかわらず、ほぼ完全なMPPサーバの自動化を可能にするOpenAPI仕様を実証する。
(iii)共通の仕様欠陥の修復に関する洞察とともに、5,066の呼び出し可能なツールのコーパスを寄贈する。
関連論文リスト
- LiveMCPBench: Can Agents Navigate an Ocean of MCP Tools? [50.60770039016318]
モデルコンテキストプロトコル(MCP)エージェントをベンチマークする最初の総合ベンチマークであるLiveMCPBenchを紹介する。
LiveMCPBenchは、MPPエコシステムに根ざした95の現実世界のタスクで構成されている。
評価は10の先行モデルを対象としており、最高の性能のモデルが78.95%の成功率に達した。
論文 参考訳(メタデータ) (2025-08-03T14:36:42Z) - MCPEval: Automatic MCP-based Deep Evaluation for AI Agent Models [76.72220653705679]
既存の手法は静的なベンチマークと労働集約的なデータ収集に依存しており、実際の評価を制限している。
我々は,オープンソースのモデルコンテキストプロトコル(MCP)ベースのフレームワークである oursystemname を紹介する。
MCPEvalはメトリクスを標準化し、ネイティブエージェントツールとシームレスに統合し、評価パイプラインを構築するための手作業を排除する。
論文 参考訳(メタデータ) (2025-07-17T05:46:27Z) - A Large-Scale Evolvable Dataset for Model Context Protocol Ecosystem and Security Analysis [8.943261888363622]
約14KのMPPサーバと300のMPPクライアントを含む大規模データセットであるMCPCorpusを紹介する。
各アーティファクトには、アイデンティティ、インターフェース設定、GitHubアクティビティ、メタデータをキャプチャする20以上の正規化された属性がアノテートされている。
MCPCorpusは、実世界のMCPエコシステムの再現可能なスナップショットを提供し、採用トレンド、エコシステムの健全性、実装の多様性の研究を可能にする。
論文 参考訳(メタデータ) (2025-06-30T02:37:27Z) - MCPWorld: A Unified Benchmarking Testbed for API, GUI, and Hybrid Computer Use Agents [14.736516215309768]
MCPWorldは、API、GUI、API-GUIハイブリッドエージェントのための最初の自動CUAテストベッドである。
MCPWorldの鍵となる原則は、ソースコードが利用可能で必要に応じて修正・再コンパイルできる「ホワイトボックスアプリ」を使うことである。
MCPWorldには201の精巧なキュレーションと注釈付きユーザタスクが含まれており、多彩なユースケースと難易度をカバーしている。
論文 参考訳(メタデータ) (2025-06-09T11:50:33Z) - MCP-Zero: Active Tool Discovery for Autonomous LLM Agents [13.005899769943442]
ツール発見の自律性を LLM 自体に復元する,アクティブエージェントフレームワークである MCP-Zero を紹介する。
すべての利用可能なツールで圧倒的なモデルを使用する代わりに、CP-Zeroはエージェントが能率ギャップを積極的に識別し、特定のツールをオンデマンドで要求することを可能にする。
公式の Model-Context-Protocol リポジトリから 308 の MCP サーバと 2,797 ツールの包括的なデータセットである MCP-tools を構築した。
論文 参考訳(メタデータ) (2025-06-01T15:48:53Z) - ScaleMCP: Dynamic and Auto-Synchronizing Model Context Protocol Tools for LLM Agents [1.7217813564531652]
ScaleMCPは、エージェントにMPPツールレトリバーを動的に装備する新しいツール選択アプローチである。
エージェントは、メモリにツールを追加する自律性に加えて、自動同期ツールストレージシステムパイプラインを提供する。
5000のファイナンシャルメトリックMCPサーバからなるデータセットを用いて総合評価を行い、ツール検索とエージェント起動性能を大幅に改善したことを示す。
論文 参考訳(メタデータ) (2025-05-09T20:30:37Z) - A Framework for Testing and Adapting REST APIs as LLM Tools [5.758488787763118]
エージェントのツールとして機能するREST APIの評価と拡張を目的とした,新しいテストフレームワークを提案する。
当社のフレームワークはapisをツールとして変換し、APIの包括的なテストケースを生成し、ケースを自然言語命令に変換し、エージェントがAPIを正しく呼び出し、そのインプットとレスポンスを処理する能力を評価する。
論文 参考訳(メタデータ) (2025-04-22T02:52:08Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z) - A Multi-Agent Approach for REST API Testing with Semantic Graphs and LLM-Driven Inputs [46.65963514391019]
私たちは、REST APIテストに依存性組み込みのマルチエージェントアプローチを採用する最初のブラックボックスツールであるAutoRestTestを紹介します。
このアプローチでは、REST APIテストを分離可能な問題として扱い、4人のエージェントがAPI探索を最適化するために協力します。
12の現実世界のRESTサービス上でのAutoRestTestの評価は、主要な4つのブラックボックスREST APIテストツールよりも優れています。
論文 参考訳(メタデータ) (2024-11-11T16:20:27Z) - Model-driven realization of IDTA submodel specifications: The good, the bad, the incompatible? [49.60138105915326]
アセット・マネジメント・シェルは産業4.0でトレンドになっている。
2024年2月、インダストリアル・デジタル・ツイン・アソシエーション (Industrial Digital Twin Association) は84と18のASサブモデル仕様を発表した。
本稿では、IDTA仕様から抽出した情報を中間メタモデルに変換し、そこからAPIコードとテストを生成するモデル駆動型アプローチを提案する。
論文 参考訳(メタデータ) (2024-06-20T16:33:46Z) - ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world
APIs [104.37772295581088]
オープンソースの大規模言語モデル(LLM)、例えばLLaMAは、ツール使用能力に大きく制限されている。
データ構築、モデルトレーニング、評価を含む汎用ツールであるToolLLMを紹介する。
ツール使用のためのインストラクションチューニングフレームワークであるToolBenchを,ChatGPTを使って自動構築する。
論文 参考訳(メタデータ) (2023-07-31T15:56:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。