論文の概要: Making OpenAPI Documentation Agent-Ready: Detecting Documentation and REST Smells with a Multi-Agent LLM System
- arxiv url: http://arxiv.org/abs/2605.14312v1
- Date: Thu, 14 May 2026 03:23:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-16 00:43:04.089424
- Title: Making OpenAPI Documentation Agent-Ready: Detecting Documentation and REST Smells with a Multi-Agent LLM System
- Title(参考訳): OpenAPIドキュメンテーションエージェント-Readyの作成:マルチエージェントLLMシステムによるドキュメントとREST Smellの検出
- Authors: Rayfran Rocha Lima, Davi G. Assunção Pinheiro, Thiago Medeiros de Menezes,
- Abstract要約: このケースは、系統的なアーティファクトレベルの評価が戦略的意思決定支援メカニズムとして機能することを示す。
エンドポイントレベルでドキュメントやREST関連の臭いを検出するマルチエージェントLLMベースのシステムであるHermesを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The growing adoption of AI agents and the Model Context Protocol (MCP) has motivated organizations to expose existing REST APIs as agent-consumable tools. In our industrial context, this initiative targeted an ecosystem of 16 production APIs comprising approximately 600 endpoints. Although these APIs were stable and widely used within a microservice architecture, early proof-of-concept experiments revealed systematic failures in task planning, tool selection, and payload construction when accessed through MCP-based agents. Rather than attributing these failures to model limitations alone, we conducted an ecosystem-scale empirical assessment of the underlying OpenAPI documentation. We developed Hermes, a multi-agent LLM-based system that detects documentation and REST-related smells at the endpoint level and generates explainable diagnostic reports. The large-scale evaluation identified 2,450 smells across 600 endpoints, with deficiencies present in all analyzed operations. Practitioner validation confirmed high agreement with the detected issues while also revealing contextual trade-offs in remediation decisions. The findings suggested that structural validity within microservice environments does not guarantee semantic readiness for agent-based consumption. Based on this evidence, the organization revised its adoption strategy, prioritizing selective endpoint adaptation, redefining documentation standards, and integrating automated documentation assessment into API governance workflows. This case illustrates how systematic artifact-level evaluation can function as a strategic decision-support mechanism, reducing technological risk and guiding evidence-based AI adoption in industrial software ecosystems.
- Abstract(参考訳): AIエージェントの採用の増加とモデルコンテキストプロトコル(MCP)は、既存のREST APIをエージェント消費可能なツールとして公開する動機となった。
私たちの産業環境では、約600のエンドポイントからなる16のプロダクションAPIのエコシステムをターゲットにしています。
これらのAPIは安定しており、マイクロサービスアーキテクチャ内で広く使用されているが、初期の概念実証実験では、MPPベースのエージェントを介してアクセスした場合、タスク計画、ツールの選択、ペイロード構築の体系的な障害が明らかになった。
制限をモデル化する上でのこれらの失敗に起因するのではなく、私たちは、基盤となるOpenAPIドキュメントのエコシステム規模の実証的な評価を実施しました。
我々は、エンドポイントレベルでドキュメントやREST関連の臭いを検知し、説明可能な診断レポートを生成するマルチエージェントLLMベースのシステムであるHermesを開発した。
大規模評価では600個の終端に2,450個の匂いが検出され,すべての解析操作に欠陥が認められた。
実践者の検証は、検出された問題と高い一致を確認し、修正決定における文脈上のトレードオフを明らかにした。
その結果、マイクロサービス環境における構造的妥当性は、エージェントベースの消費に対する意味的準備性を保証するものではないことが示唆された。
この証拠に基づいて、組織は採用戦略を改訂し、選択的エンドポイント適応の優先順位付け、ドキュメント標準の再定義、自動ドキュメントアセスメントをAPIガバナンスワークフローに統合した。
このケースでは、システマティックなアーティファクトレベルの評価が、戦略的意思決定支援メカニズムとして機能し、技術的リスクを低減し、産業ソフトウェアエコシステムにおけるエビデンスベースのAIの採用を導く方法について説明している。
関連論文リスト
- AGAPI-Agents: An Open-Access Agentic AI Platform for Accelerated Materials Design on AtomGPT.org [0.8093011368737527]
AGAPI(AtomGPT.org API)は、8以上のオープンソースと20以上のマテリアルサイエンスAPIエンドポイントを統合するオープンアクセスエージェントAIプラットフォームである。
我々は、ヘテロ構造の構築、粉末X線回折分析、半導体欠陥工学を含む、エンドツーエンドの構築を通してAGAPIを実証する。
1000人以上のアクティブユーザを抱えるAGAPIは、再現可能でAIが加速する材料発見のための、スケーラブルで透明な基盤を提供する。
論文 参考訳(メタデータ) (2025-12-12T06:28:28Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - Automatic Building Code Review: A Case Study [6.530899637501737]
建設担当者は、プロジェクトのサイズと複雑さが増大するにつれて、労働集約的で、エラーを起こし、コストがかかる設計文書のレビューに直面します。
本研究では,BIMに基づくデータ抽出と自動検証を統合したエージェント駆動型フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-03T00:30:14Z) - MCPEval: Automatic MCP-based Deep Evaluation for AI Agent Models [76.72220653705679]
我々は、エンドツーエンドタスク生成とインテリジェントエージェントの深い評価を自動化するオープンソースのフレームワークであるMCPEvalを紹介する。
MCPEvalはメトリクスを標準化し、ネイティブエージェントツールとシームレスに統合し、評価パイプラインを構築するための手作業を排除する。
実世界の5つのドメインにまたがる実証的な結果から、ニュアンスのある、ドメイン固有のパフォーマンスを明らかにする効果が示された。
論文 参考訳(メタデータ) (2025-07-17T05:46:27Z) - Deep Research Agents: A Systematic Examination And Roadmap [109.53237992384872]
Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文 参考訳(メタデータ) (2025-06-22T16:52:48Z) - A Framework for Testing and Adapting REST APIs as LLM Tools [11.757827071584737]
大きな言語モデル(LLM)は、外部ツールで複雑なタスクを実行する自律エージェントを構築するために、ますます使われています。
現在のベンチマークではこれらの課題を見落としており、エージェント駆動自動化のためのAPI準備性の評価のギャップが残っている。
LLMエージェント用のPythonツールとしてラップされたエンタープライズAPIを体系的に評価するテストフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-22T02:52:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。