論文の概要: Deploy-Master: Automating the Deployment of 50,000+ Agent-Ready Scientific Tools in One Day
- arxiv url: http://arxiv.org/abs/2601.03513v1
- Date: Wed, 07 Jan 2026 02:00:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-08 18:12:46.114516
- Title: Deploy-Master: Automating the Deployment of 50,000+ Agent-Ready Scientific Tools in One Day
- Title(参考訳): Deploy-Master: 50,000以上のエージェント対応科学ツールを1日でデプロイする
- Authors: Yi Wang, Zhenting Huang, Zhaohan Ding, Ruoxue Liao, Yuan Huang, Xinzijian Liu, Jiajun Xie, Siheng Chen, Linfeng Zhang,
- Abstract要約: Deploy-Masterは、大規模なツール発見、ビルド仕様推論、実行ベースのバリデーション、パブリッシュのためのワンストップのエージェントワークフローである。
1日で52,550回のビルドテストを行い,50,112の科学的ツールで再現可能な環境を構築した。
スループット、コストプロファイル、障害面、大規模でしか見えない仕様の不確実性を特徴付ける5万ツール規模のデプロイメントトレースを報告します。
- 参考スコア(独自算出の注目度): 37.83274797886782
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-source scientific software is abundant, yet most tools remain difficult to compile, configure, and reuse, sustaining a small-workshop mode of scientific computing. This deployment bottleneck limits reproducibility, large-scale evaluation, and the practical integration of scientific tools into modern AI-for-Science (AI4S) and agentic workflows. We present Deploy-Master, a one-stop agentic workflow for large-scale tool discovery, build specification inference, execution-based validation, and publication. Guided by a taxonomy spanning 90+ scientific and engineering domains, our discovery stage starts from a recall-oriented pool of over 500,000 public repositories and progressively filters it to 52,550 executable tool candidates under license- and quality-aware criteria. Deploy-Master transforms heterogeneous open-source repositories into runnable, containerized capabilities grounded in execution rather than documentation claims. In a single day, we performed 52,550 build attempts and constructed reproducible runtime environments for 50,112 scientific tools. Each successful tool is validated by a minimal executable command and registered in SciencePedia for search and reuse, enabling direct human use and optional agent-based invocation. Beyond delivering runnable tools, we report a deployment trace at the scale of 50,000 tools, characterizing throughput, cost profiles, failure surfaces, and specification uncertainty that become visible only at scale. These results explain why scientific software remains difficult to operationalize and motivate shared, observable execution substrates as a foundation for scalable AI4S and agentic science.
- Abstract(参考訳): オープンソースの科学ソフトウェアは豊富だが、ほとんどのツールはコンパイル、構成、再利用が困難であり、科学計算の小さな作業モードを維持している。
このデプロイメントボトルネックは、再現性、大規模な評価、現代のAI-for-Science(AI4S)とエージェントワークフローへの科学的ツールの実践的な統合を制限する。
大規模なツール発見、ビルド仕様推論、実行ベースのバリデーション、パブリッシュのためのワンストップエージェントワークフローであるDeploy-Masterを紹介します。
90以上の科学と工学の領域にまたがる分類によってガイドされた私たちの発見段階は、50,000以上のパブリックリポジトリのリコール指向のプールから始まり、ライセンスと品質の基準の下で52,550の実行可能なツール候補に徐々にフィルタリングします。
Deploy-Masterは異質なオープンソースリポジトリを、ドキュメントのクレームではなく、実行時に基盤となる実行可能なコンテナ化機能に変換する。
1日で52,550回のビルド試行を行い,50,112の科学的ツールを対象とした再現可能な実行環境を構築した。
それぞれの成功したツールは最小限の実行可能なコマンドで検証され、検索と再利用のためにSciencePediaに登録される。
実行可能なツールの提供以外にも、スループット、コストプロファイル、障害表面、大規模でしか見えない仕様の不確実性など、50,000ツール規模のデプロイメントトレースを報告しています。
これらの結果は、スケーラブルなAI4Sとエージェント科学の基礎として、科学ソフトウェアが共有された観測可能な実行基板を運用し、動機付けるのが難しい理由を説明している。
関連論文リスト
- Bohrium + SciMaster: Building the Infrastructure and Ecosystem for Agentic Science at Scale [82.20980951765891]
エージェントサイエンスのスケーリングにはインフラストラクチャ・アンド・エコシステムアプローチが必要である,と我々は主張する。
BohriumはAI4S資産のマネージドでトレース可能なハブとして機能し、多様な科学データ、ソフトウェア、計算、実験室のシステムをエージェント対応の能力に変換する。
SciMasterはこれらの機能を長い水平科学に編成し、科学エージェントを合成して実行することができる。
論文 参考訳(メタデータ) (2025-12-23T16:04:41Z) - An Agentic Framework for Autonomous Materials Computation [70.24472585135929]
大規模言語モデル(LLM)は、科学的発見を加速するための強力なツールとして登場した。
近年の進歩はLLMをエージェントフレームワークに統合し、複雑な科学実験のための検索、推論、ツールの使用を可能にしている。
本稿では,第一原理計算の信頼性向上を目的としたドメイン特化エージェントを提案する。
論文 参考訳(メタデータ) (2025-12-22T15:03:57Z) - Simple Agents Outperform Experts in Biomedical Imaging Workflow Optimization [69.36509281190662]
生産レベルのコンピュータビジョンツールを科学データセットに適応させることは、重要な"ラストマイル"ボトルネックである。
我々は、AIエージェントを使ってこの手動コーディングを自動化し、最適なエージェント設計のオープンな問題に焦点を当てる。
簡単なエージェントフレームワークが、人間-専門家のソリューションよりも優れた適応コードを生成することを実証する。
論文 参考訳(メタデータ) (2025-12-02T18:42:26Z) - The Tool Decathlon: Benchmarking Language Agents for Diverse, Realistic, and Long-Horizon Task Execution [86.4588675093384]
Toolathlonは、多様なアプリやツール、現実的な環境設定、信頼性の高い実行ベースの評価を提供する言語エージェントのベンチマークである。
このベンチマークには、手動でソースまたはクラフトされたタスクが108つ含まれており、平均20回以上にわたって複数のアプリと対話する必要がある。
Toolathlonは、より有能な言語エージェントを現実の長期タスク実行のために開発することを期待しています。
論文 参考訳(メタデータ) (2025-10-29T17:32:49Z) - MCPVerse: An Expansive, Real-World Benchmark for Agentic Tool Use [72.53177559476704]
我々はエージェントツールの使用を評価するための実世界のベンチマークであるMCPVerseを紹介する。
MCPVerseは550以上の実世界の実行可能なツールを統合し、140kトークンを超える前例のないアクション空間を作成する。
私たちは最先端のLSMを3つのモード(Oracle、Standard、Max-Scale)でベンチマークしました。
論文 参考訳(メタデータ) (2025-08-22T09:47:53Z) - SciToolAgent: A Knowledge Graph-Driven Scientific Agent for Multi-Tool Integration [39.43814195462455]
SciToolAgentは生物学、化学、材料科学にまたがる何百もの科学ツールを自動化する。
エージェントはまた、責任と倫理的ツールの使用を保証するために、包括的な安全チェックモジュールも組み込んでいる。
論文 参考訳(メタデータ) (2025-07-27T13:55:35Z) - LLM Agents Making Agent Tools [2.5529148902034637]
ツールの使用は、大規模言語モデル(LLM)を、複雑なマルチステップタスクを実行できる強力なエージェントに変えた。
しかし、これらのツールは人間の開発者によって事前に実装されなければならない。
論文をコードで自律的にLLM互換のツールに変換するエージェントフレームワークであるToolMakerを提案する。
論文 参考訳(メタデータ) (2025-02-17T11:44:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。