論文の概要: SynthTools: A Framework for Scaling Synthetic Tools for Agent Development
- arxiv url: http://arxiv.org/abs/2511.09572v1
- Date: Fri, 14 Nov 2025 01:00:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.334216
- Title: SynthTools: A Framework for Scaling Synthetic Tools for Agent Development
- Title(参考訳): SynthTools: エージェント開発のためのシンセティックツールのスケーリングフレームワーク
- Authors: Tommaso Castellani, Naimeng Ye, Daksh Mittal, Thomson Yen, Hongseok Namkoong,
- Abstract要約: 合成ツールエコシステムを生成するためのフレキシブルでスケーラブルなフレームワークであるSynthToolsを紹介します。
私たちのフレームワークは3つのコアコンポーネントで構成されています。多種多様なツールの自動作成のためのツール生成、現実的なツールの振る舞いをエミュレートするツールシミュレーション、ツールシミュレーションの正確性と一貫性を保証するツール監査です。
スケーラブルで多様性があり、信頼性の高いツールエコシステムを実現することで、SynthToolsは大規模なトレーニングへの実践的なパスと、ツール使用エージェントの安定した評価を提供する。
- 参考スコア(独自算出の注目度): 5.411691071249542
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI agents increasingly rely on external tools to solve complex, long-horizon tasks. Advancing such agents requires reproducible evaluation and large-scale training in controllable, diverse, and realistic tool-use environments. However, real-world APIs are limited in availability, domain coverage, and stability, often requiring access keys and imposing rate limits, which render them impractical for stable evaluation or scalable training. To address these challenges, we introduce SynthTools, a flexible and scalable framework for generating synthetic tool ecosystems. Our framework consists of three core components: Tool Generation for automatic and scalable creation of diverse tools, Tool Simulation to emulate realistic tool behaviors, and Tool Audit to ensure correctness and consistency of tool simulation. To illustrate its scalability, we show that SynthTools can readily produce toolsets that span twice as many domains and twice as many tools per domain as prior work. Furthermore, the tool simulation and tool audit components demonstrate strong reliability, achieving $94\%$ and $99\%$ accuracy respectively. Finally, we construct downstream tasks from the generated tools that even state-of-the-art models struggle to complete. By enabling scalable, diverse, and reliable tool ecosystems, SynthTools provides a practical path toward large-scale training and stable evaluation of tool-use agents. Our code is available at https://github.com/namkoong-lab/SynthTools.
- Abstract(参考訳): AIエージェントは、複雑な長期タスクを解決するために、ますます外部ツールに依存している。
このようなエージェントを改良するには、再現可能な評価と、制御可能で多様性があり、現実的なツール使用環境における大規模なトレーニングが必要である。
しかし、現実のAPIは可用性、ドメインカバレッジ、安定性に制限されており、しばしばアクセスキーとインポーティングレート制限を必要とするため、安定した評価やスケーラブルなトレーニングには実用的ではない。
これらの課題に対処するために、私たちはSynthToolsという、合成ツールエコシステムを生成するための柔軟でスケーラブルなフレームワークを紹介します。
私たちのフレームワークは3つのコアコンポーネントで構成されています。多種多様なツールの自動作成のためのツール生成、現実的なツールの振る舞いをエミュレートするツールシミュレーション、ツールシミュレーションの正確性と一貫性を保証するツール監査です。
スケーラビリティを説明するために、SynthToolsは、以前の作業の2倍のドメイン、1ドメインあたりの2倍のツールセットを簡単に作成できることを示します。
さらに、ツールシミュレーションとツール監査コンポーネントは信頼性が高く、それぞれ9,4 %$と99 %$の精度を実現している。
最後に、最先端のモデルでさえ完成に苦しむ生成ツールから下流タスクを構築します。
スケーラブルで多様性があり、信頼性の高いツールエコシステムを実現することで、SynthToolsは大規模なトレーニングへの実践的なパスと、ツール使用エージェントの安定した評価を提供する。
私たちのコードはhttps://github.com/namkoong-lab/SynthTools.comで利用可能です。
関連論文リスト
- ToolLibGen: Scalable Automatic Tool Creation and Aggregation for LLM Reasoning [80.10274552177096]
外部ツールを備えたLarge Language Models (LLM) は、複雑な推論タスクにおけるパフォーマンスの向上を実証している。
このツールに強化された推論が広く採用されるのは、ドメイン固有のツールが不足しているためである。
構造化ツールライブラリに非構造化ツールのコレクションを自動的に組み込むための体系的なアプローチを提案する。
論文 参考訳(メタデータ) (2025-10-09T04:11:16Z) - Tool-R1: Sample-Efficient Reinforcement Learning for Agentic Tool Use [50.02614257515131]
大規模言語モデル(LLM)は、言語理解と推論において強力な能力を示している。
本稿では,LLMの汎用的,構成的,多段階的なツール使用を可能にする強化学習フレームワークであるTool-R1を提案する。
論文 参考訳(メタデータ) (2025-09-16T09:22:21Z) - VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use [78.29315418819074]
VerlToolは、体系的な設計原則を通じて制限に対処する統一的でモジュール化されたフレームワークです。
我々のフレームワークはARLTをマルチターントラジェクトリとして定式化し、マルチモード観測トークン(テキスト/画像/ビデオ)を単一ターンRLVRパラダイムを超えて拡張する。
モジュール化されたプラグインアーキテクチャは、軽量Python定義のみを必要とする迅速なツール統合を可能にする。
論文 参考訳(メタデータ) (2025-09-01T01:45:18Z) - Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments [70.42705564227548]
大規模言語モデル(LLM)のための環境自動構築パイプラインを提案する。
これにより、外部ツールに頼ることなく、詳細な測定可能なフィードバックを提供する高品質なトレーニング環境の作成が可能になる。
また、ツール使用の精度とタスク実行の完全性の両方を評価する検証可能な報酬機構も導入する。
論文 参考訳(メタデータ) (2025-08-12T09:45:19Z) - ToolGen: Unified Tool Retrieval and Calling via Generation [34.34787641393914]
ToolGenは、ツール知識を大きな言語モデルのパラメータに直接統合するパラダイムシフトです。
ToolGenは、ツール検索と自律タスク補完の両方において、優れた結果が得られることを示す。
ToolGenは、より汎用的で効率的で自律的なAIシステムを実現する。
論文 参考訳(メタデータ) (2024-10-04T13:52:32Z) - MetaTool: Facilitating Large Language Models to Master Tools with Meta-task Augmentation [25.360660222418183]
再利用可能なツールセットにまたがって一般化するために設計された,新しいツール学習手法であるMetaToolを紹介する。
メタタスクデータをタスク指向トレーニングに組み込むことで,オープンソースの大規模言語モデルの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2024-07-15T10:15:41Z) - Making Language Models Better Tool Learners with Execution Feedback [36.30542737293863]
ツールは、人間が環境を理解し、形を変えることができる重要なインターフェースとして機能する。
既存のツール学習手法は、ツールを無差別に活用するために大きな言語モデルを誘導する。
ツール実行からのフィードバックを通じてモデルを継続的に学習することを可能にする2段階のエンドツーエンドフレームワークであるTool leaRning wIth exeCution fEedback (TRICE)を提案する。
論文 参考訳(メタデータ) (2023-05-22T14:37:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。