Fugu-MT 論文翻訳(概要): How are AI agents used? Evidence from 177,000 MCP tools

論文の概要: How are AI agents used? Evidence from 177,000 MCP tools

arxiv url: http://arxiv.org/abs/2603.23802v1
Date: Wed, 25 Mar 2026 00:25:49 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-26 21:06:11.06903
Title: How are AI agents used? Evidence from 177,000 MCP tools
Title（参考訳）: AIエージェントの使い方 : 17万7000のMPPツールによる証拠
Authors: Merlin Stein,
Abstract要約: 公開モデルコンテキストプロトコル(MCP)サーバレポジトリを監視することにより,11/2024から02/2026までの177,436のAIエージェントツールを評価した。ソフトウェア開発はすべてのエージェントツールの67%、MSPサーバの90%を占める。ほとんどのアクションツールはファイルの編集のような中途半端なタスクをサポートするが、財務取引のような高額なタスクのためのアクションツールもある。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Today's AI agents are built on large language models (LLMs) equipped with tools to access and modify external environments, such as corporate file systems, API-accessible platforms and websites. AI agents offer the promise of automating computer-based tasks across the economy. However, developers, researchers and governments lack an understanding of how AI agents are currently being used, and for what kinds of (consequential) tasks. To address this gap, we evaluated 177,436 agent tools created from 11/2024 to 02/2026 by monitoring public Model Context Protocol (MCP) server repositories, the current predominant standard for agent tools. We categorise tools according to their direct impact: perception tools to access and read data, reasoning tools to analyse data or concepts, and action tools to directly modify external environments, like file editing, sending emails or steering drones in the physical world. We use O*NET mapping to identify each tool's task domain and consequentiality. Software development accounts for 67% of all agent tools, and 90% of MCP server downloads. Notably, the share of 'action' tools rose from 27% to 65% of total usage over the 16-month period sampled. While most action tools support medium-stakes tasks like editing files, there are action tools for higher-stakes tasks like financial transactions. Using agentic financial transactions as an example, we demonstrate how governments and regulators can use this monitoring method to extend oversight beyond model outputs to the tool layer to monitor risks of agent deployment.
Abstract（参考訳）: 今日のAIエージェントは,企業ファイルシステムやAPIアクセス可能なプラットフォーム,Webサイトなど,外部環境へのアクセスと修正を行うツールを備えた,大規模な言語モデル(LLM)上に構築されている。 AIエージェントは、経済全体でコンピューターベースのタスクを自動化するという約束を提供する。しかし、開発者、研究者、そして政府は、現在AIエージェントがどのように使われているか、そしてどのような(連続的な)タスクについて理解していない。このギャップに対処するため、エージェントツールの現在支配的な標準である公開モデルコンテキストプロトコル(MCP)サーバリポジトリを監視することで、11/2024から02/2026までの177,436のエージェントツールを評価した。データにアクセスして読むための知覚ツール、データや概念を分析する推論ツール、ファイル編集やメールの送信、物理的な世界でドローンを操縦するなど、外部環境を直接修正するためのアクションツールです。 O*NETマッピングを使用して、各ツールのタスクドメインとシーケンスを識別します。ソフトウェア開発はすべてのエージェントツールの67%、MSPサーバの90%を占める。特に、"アクション"ツールのシェアは16ヶ月間の総使用量の27%から65%に増加した。ほとんどのアクションツールはファイルの編集のような中途半端なタスクをサポートするが、財務取引のような高額なタスクのためのアクションツールもある。エージェント・ファイナンシャル・トランザクションを例として、政府機関や規制当局がこの監視方法を用いて、モデル出力以上の監視をツール・レイヤに拡張し、エージェント・デプロイメントのリスクをモニタリングする方法を実証する。

関連論文リスト

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization [51.92237664440418]
ToolRosettaは、オープンソースのコードリポジトリとAPIを自動的にMPP互換のツールに変換するフレームワークである。ユーザタスクが与えられた場合、ToolRosettaはツールチェーンを自律的に計画し、関連するツールチェーンを特定し、実行可能なMPPサービスに変換する。
論文参考訳（メタデータ） (2026-03-10T07:19:43Z)
MCPAgentBench: A Real-world Task Benchmark for Evaluating LLM Agent MCP Tool Use [12.220519951554133]
MCPAgentBenchは、エージェントのツール使用能力を評価するための実世界のMCP定義に基づくベンチマークである。評価には動的サンドボックス環境が使われており、エージェントにイントラクタを含む候補ツールリストを表示する。さまざまな最新の主要言語モデルで実施された実験は、複雑で多段階のツール呼び出しの処理において、大きなパフォーマンス上の違いを示している。
論文参考訳（メタデータ） (2025-12-31T02:09:48Z)
Tool-to-Agent Retrieval: Bridging Tools and Agents for Scalable LLM Multi-Agent Systems [1.2092584191043323]
ツールと親エージェントの両方を共有ベクトル空間に埋め込む統合フレームワークであるTool-to-Agent Retrievalを紹介する。ツールの機能を明示的に表現し,メタデータをエージェントレベルにトラバースすることで,ツールからエージェントレベルの詳細な検索が可能になる。
論文参考訳（メタデータ） (2025-11-03T18:58:28Z)
DeepAgent: A General Reasoning Agent with Scalable Toolsets [111.6384541877723]
DeepAgentは、自律的な思考、ツール発見、アクション実行を実行するエンドツーエンドのディープ推論エージェントである。長期にわたる相互作用の課題に対処するために,過去の相互作用を構造化エピソード,動作,ツール記憶に圧縮する自律的メモリ折り畳み機構を導入する。 LLMシミュレートされたAPIを活用し、ツール呼び出しトークンにきめ細かいクレジットを割り当てるツールコールアドバンテージ属性を適用した、エンドツーエンドの強化学習戦略であるToolPOを開発した。
論文参考訳（メタデータ） (2025-10-24T16:24:01Z)
TheMCPCompany: Creating General-purpose Agents with Task-specific Tools [12.249551019598442]
TheMCPCompanyは、様々な現実世界のサービスと対話するタスクにおいて、ツールコールエージェントを評価するためのベンチマークである。また、各タスクに手動でアノテートされた接地木ツールも提供します。全体として、我々の研究は、最も高度な推論モデルは、より単純な環境でツールを見つけるのに効果的であるが、複雑なエンタープライズ環境をナビゲートするのに深刻な苦労をしていることを示している。
論文参考訳（メタデータ） (2025-10-22T06:42:01Z)
LLM Agents Making Agent Tools [2.5529148902034637]
ツールの使用は、大規模言語モデル(LLM)を、複雑なマルチステップタスクを実行できる強力なエージェントに変えた。しかし、これらのツールは人間の開発者によって事前に実装されなければならない。論文をコードで自律的にLLM互換のツールに変換するエージェントフレームワークであるToolMakerを提案する。
論文参考訳（メタデータ） (2025-02-17T11:44:11Z)
SMART: Self-Aware Agent for Tool Overuse Mitigation [58.748554080273585]
現在のLarge Language Model (LLM) エージェントは、強力な推論とツールの使用能力を示すが、しばしば自己認識に欠ける。この不均衡はツール・オーバーユースにつながり、モデルはパラメトリックな知識を持つタスクに対して、不要に外部ツールに依存する。 SMART(Strategic Model-Aware Reasoning with Tools)は、エージェントの自己認識を高め、タスクハンドリングを最適化し、ツールの過剰使用を減らすパラダイムである。
論文参考訳（メタデータ） (2025-02-17T04:50:37Z)
SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。 SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文参考訳（メタデータ） (2024-05-06T17:41:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。