論文の概要: The Evolution of Tool Use in LLM Agents: From Single-Tool Call to Multi-Tool Orchestration
- arxiv url: http://arxiv.org/abs/2603.22862v1
- Date: Tue, 24 Mar 2026 07:05:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.34632
- Title: The Evolution of Tool Use in LLM Agents: From Single-Tool Call to Multi-Tool Orchestration
- Title(参考訳): LLMエージェントにおけるツール利用の進化:シングルツールコールからマルチツールオーケストレーションへ
- Authors: Haoyuan Xu, Chang Li, Xinyan Ma, Xianhao Ou, Zihan Zhang, Tao He, Xiangyu Liu, Zixiang Wang, Jiafeng Liang, Zheng Chu, Runxuan Liu, Rongchuan Mu, Ming Liu, Bing Qin,
- Abstract要約: ツールの使用により、大きな言語モデルが外部情報にアクセスし、ソフトウェアシステムを実行し、モデルパラメータだけで解決できるもの以外のデジタル環境で動作することができる。
エージェントシステムが進化するにつれて、中央の問題は、中途半端な状態、実行フィードバック、環境の変化、安全性、コスト、検証可能性といった実践的な制約によって、孤立呼び出しからマルチツールオーケストレーションへと移行した。
推論時の計画と実行、トレーニングと軌道構築、安全と制御、リソース制約下での効率性、オープン環境における能力の完全性、およびベンチマーク設計と評価の6つの分野に関する文献を整理する。
- 参考スコア(独自算出の注目度): 58.062622978943885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tool use enables large language models (LLMs) to access external information, invoke software systems, and act in digital environments beyond what can be solved from model parameters alone. Early research mainly studied whether a model could select and execute a correct single tool call. As agent systems evolve, however, the central problem has shifted from isolated invocation to multi-tool orchestration over long trajectories with intermediate state, execution feedback, changing environments, and practical constraints such as safety, cost, and verifiability. We comprehensively review recent progress in multi-tool LLM agents and analyzes the state of the art in this rapidly developing area. First, we unify task formulations and distinguish single-call tool use from long-horizon orchestration. Then, we organize the literature around six core dimensions: inference-time planning and execution, training and trajectory construction, safety and control, efficiency under resource constraints, capability completeness in open environments, and benchmark design and evaluation. We further summarize representative applications in software engineering, enterprise workflows, graphical user interfaces, and mobile systems. Finally, we discuss major challenges and outline future directions for building reliable, scalable, and verifiable multi-tool agents.
- Abstract(参考訳): ツールの使用により、大きな言語モデル(LLM)が外部情報にアクセスし、ソフトウェアシステムを呼び出すことができ、モデルパラメータだけで解決できるもの以外のデジタル環境で動作することができる。
初期の研究では、モデルが正しい単一のツールコールを選択し実行できるかを主に研究した。
しかしエージェントシステムが進化するにつれて、中央の問題は隔離された呼び出しから、中間状態、実行フィードバック、環境の変化、安全性、コスト、検証可能性といった現実的な制約を含む長い軌道上でのマルチツールオーケストレーションへと移行してきた。
マルチツールLSMエージェントの最近の進歩を概観し、この急速に発展している領域における最先端技術を分析した。
まず、タスクの定式化を統一し、単一呼び出しツールの使用と長距離オーケストレーションを区別する。
次に、推測時計画と実行、訓練と軌道構築、安全と制御、資源制約下での効率性、オープン環境における能力の完全性、およびベンチマーク設計と評価の6つの基本分野に関する文献を整理する。
さらに、ソフトウェア工学、エンタープライズワークフロー、グラフィカルユーザインタフェース、モバイルシステムにおける代表的アプリケーションについて要約する。
最後に、主要な課題について議論し、信頼性があり、スケーラブルで検証可能なマルチツールエージェントを構築するための今後の方向性について概説する。
関連論文リスト
- LLM-Based Agentic Systems for Software Engineering: Challenges and Opportunities [0.03437656066916039]
本論文は,LLMに基づくマルチエージェントシステムの新しいパラダイムを体系的にレビューする。
言語モデルの選択、SE評価ベンチマーク、最先端のエージェントフレームワーク、通信プロトコルなど、幅広いトピックを掘り下げる。
論文 参考訳(メタデータ) (2026-01-14T19:28:30Z) - Agentic Systems in Radiology: Design, Applications, Evaluation, and Challenges [13.53016942028838]
大型言語モデル(LLM)は、自然言語を使って情報を統合し、指示に従い、推論と計画の形式を実行することができる。
マルチモーダルなデータストリームと複数のシステムにまたがるオーケストレーションによって、ラジオロジーはコンテキストに適応し、繰り返しながら複雑なタスクを自動化するエージェントの恩恵を受けるのに一意に適している。
本稿では, LLMエージェントシステムの設計を概観し, 主要なアプリケーションを強調し, 計画とツール使用の評価方法について議論し, エラーカスケード, ツール使用効率, 健康IT統合といった課題の概要を述べる。
論文 参考訳(メタデータ) (2025-10-10T13:56:27Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - TimeSeriesGym: A Scalable Benchmark for (Time Series) Machine Learning Engineering Agents [17.296425855109426]
人工知能(AI)エージェントを評価するためのスケーラブルなベンチマークフレームワークであるTimeSeriesGymを紹介する。
TimeSeriesGymには、複数のドメインやタスクにまたがるさまざまなソースからの課題が含まれている。
提出ファイルやコード,モデルなど,複数の研究成果物に対する評価機構を実装した。
論文 参考訳(メタデータ) (2025-05-19T16:11:23Z) - Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger [49.81945268343162]
我々は,外部ツール利用のための適応型意思決定戦略であるMeCoを提案する。
MeCoは、表現空間内の高レベル認知信号をキャプチャすることで、メタ認知スコアを定量化する。
MeCoは微調整不要で、最小限のコストがかかる。
論文 参考訳(メタデータ) (2025-02-18T15:45:01Z) - Tool Learning in the Wild: Empowering Language Models as Automatic Tool Agents [56.822238860147024]
大規模な言語モデルを外部ツールで拡張することは、彼らのユーティリティを拡張するための有望なアプローチとして現れました。
以前のメソッドは、ツールドキュメントを手動で解析し、コンテキスト内デモを作成し、ツールをLLMがステップバイステップの推論で使用する構造化フォーマットに変換する。
LLMがツール使用ワークフローを自動化できるフレームワークであるAutoToolsを提案する。
論文 参考訳(メタデータ) (2024-05-26T11:40:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。