論文の概要: Utility-Guided Agent Orchestration for Efficient LLM Tool Use
- arxiv url: http://arxiv.org/abs/2603.19896v1
- Date: Fri, 20 Mar 2026 12:29:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.130686
- Title: Utility-Guided Agent Orchestration for Efficient LLM Tool Use
- Title(参考訳): 効率的なLCM工具使用のための実用誘導型エージェントオーケストレーション
- Authors: Boyan Liu, Gongming Zhao, Hongli Xu,
- Abstract要約: エージェントオーケストレーションを明示的な決定問題として研究する。
本稿では、応答、検索、ツール呼び出し、検証、停止などのアクションの中から選択するユーティリティ誘導オーケストレーションポリシーを提案する。
- 参考スコア(独自算出の注目度): 24.97962970486756
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tool-using large language model (LLM) agents often face a fundamental tension between answer quality and execution cost. Fixed workflows are stable but inflexible, while free-form multi-step reasoning methods such as ReAct may improve task performance at the expense of excessive tool calls, longer trajectories, higher token consumption, and increased latency. In this paper, we study agent orchestration as an explicit decision problem rather than leaving it entirely to prompt-level behavior. We propose a utility-guided orchestration policy that selects among actions such as respond, retrieve, tool call, verify, and stop by balancing estimated gain, step cost, uncertainty, and redundancy. Our goal is not to claim universally best task performance, but to provide a controllable and analyzable policy framework for studying quality-cost trade-offs in tool-using LLM agents. Experiments across direct answering, threshold control, fixed workflows, ReAct, and several policy variants show that explicit orchestration signals substantially affect agent behavior. Additional analyses on cost definitions, workflow fairness, and redundancy control further demonstrate that lightweight utility design can provide a defensible and practical mechanism for agent control.
- Abstract(参考訳): ツールを使用する大規模言語モデル(LLM)エージェントは、答えの品質と実行コストの根本的な緊張に直面することが多い。
固定ワークフローは安定しているが、ReActのような自由形式のマルチステップ推論手法は、過剰なツール呼び出し、長いトラジェクトリ、トークン消費の増加、遅延の増加を犠牲にしてタスクパフォーマンスを向上させる。
本稿では,エージェントオーケストレーションを,プロンプトレベルの動作に完全に依存するのではなく,明示的な決定問題として検討する。
本稿では,評価ゲイン,ステップコスト,不確実性,冗長性のバランスをとることで,応答,検索,ツールコール,検証,停止などのアクションを選択するユーティリティ誘導型オーケストレーションポリシーを提案する。
我々のゴールは、普遍的に最高のタスクパフォーマンスを主張するのではなく、ツール使用のLLMエージェントの品質コストトレードオフを研究するための制御可能な、分析可能なポリシーフレームワークを提供することです。
直接応答、しきい値制御、固定ワークフロー、ReAct、およびいくつかのポリシー変種にわたる実験は、明示的なオーケストレーション信号がエージェントの振る舞いに大きく影響していることを示している。
コスト定義、ワークフローの公正性、冗長性制御に関するさらなる分析により、軽量なユーティリティ設計がエージェント制御の防御的で実用的なメカニズムを提供することを示した。
関連論文リスト
- When Should a Robot Think? Resource-Aware Reasoning via Reinforcement Learning for Embodied Robotic Decision-Making [68.12864562049957]
身体ロボットシステムは、高レベルの推論をサポートするために、大規模言語モデル(LLM)ベースのエージェントにますます依存している。
エージェントはいつ、いつ、いつ行動すべきか?
本稿では,エンボディエージェントのリソース・アウェア・オーケストレーションのための階層的なフレームワークであるRARRL(Resource-Aware Reasoning via Reinforcement Learning)を提案する。
論文 参考訳(メタデータ) (2026-03-17T15:38:50Z) - Graph-Based Self-Healing Tool Routing for Cost-Efficient LLM Agents [0.0]
自己修復ルータはフォールトトレラントなオーケストレーションアーキテクチャである。
ほとんどのエージェント制御フロー決定を、推論よりもルーティングとして扱う。
すべての障害はログ化されたリルートか明示的なエスカレーションのどちらかで、無音スキップはしない。
論文 参考訳(メタデータ) (2026-03-02T07:21:15Z) - FlowSteer: Interactive Agentic Workflow Orchestration via End-to-End Reinforcement Learning [49.369614288007334]
FlowSteerは、エージェントと実行可能なキャンバス環境として軽量なポリシーモデルを採用する、エンドツーエンドの強化学習フレームワークである。
FlowSteerは様々なタスクでベースラインを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2026-02-02T05:30:42Z) - Optimizing Agentic Workflows using Meta-tools [3.3298825663516403]
Agentic AIは、LLMが複雑なタスクを解決するためのツールを動的に推論し、計画し、相互作用することを可能にする。
この作業では、冗長なツール実行パターンを特定し、最適化するフレームワークであるAWO(Agent Optimization)を導入している。
AWO は LLM の呼び出し回数を 11.9% まで削減し、タスク成功率を 4.2% まで引き上げている。
論文 参考訳(メタデータ) (2026-01-29T17:43:08Z) - Budget-Aware Tool-Use Enables Effective Agent Scaling [82.6942342482552]
大規模言語モデル(LLM)におけるタスク間のテスト時間計算のスケーリングによるパフォーマンス向上
本研究では,これらのエージェントを,Web検索エージェントを中心に,明示的なツールコール予算の下で効果的にスケールする方法について検討する。
私たちは、エージェントに継続的な予算意識を提供する軽量プラグインであるBudget Trackerを紹介します。
論文 参考訳(メタデータ) (2025-11-21T07:18:55Z) - The Cost of Dynamic Reasoning: Demystifying AI Agents and Test-Time Scaling from an AI Infrastructure Perspective [3.0868637098088403]
大規模言語モデル(LLM)ベースのAIエージェントは最近、動的推論を採用することで、印象的な汎用性を示した。
本稿では,AIエージェントを包括的に分析し,リソース使用量,遅延動作,エネルギー消費,テストタイムスケーリング戦略を定量化する。
その結果,エージェントは計算量の増加によって精度が向上する一方で,急速に低下するリターン,レイテンシのばらつきの拡大,持続不可能なインフラストラクチャコストに悩まされていることがわかった。
論文 参考訳(メタデータ) (2025-06-04T14:37:54Z) - Learning to Use Tools via Cooperative and Interactive Agents [58.77710337157665]
ツール学習は、外部ツールを使用してユーティリティを拡張するエージェントとして、大きな言語モデル(LLM)を促進する。
ツール選択,ツール実行,アクションキャリブレーションの3つの特別なエージェントを個別にコーディネートする,協調型対話型エージェントフレームワークであるConAgentsを提案する。
3つのデータセットに対する実験により、LLMは、ConAgentsを装備した場合、大幅に改善されたベースラインよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-05T15:08:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。