論文の概要: Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use
- arxiv url: http://arxiv.org/abs/2602.11541v1
- Date: Thu, 12 Feb 2026 04:01:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.629953
- Title: Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use
- Title(参考訳): 予算制約付きエージェント型大規模言語モデル:コストツール利用のための意図に基づく計画
- Authors: Hanbing Liu, Chunhao Tian, Nan An, Ziyuan Wang, Pinyan Lu, Changyuan Yu, Qi Qi,
- Abstract要約: 予算制約付きツール強化エージェントについて検討し、厳格な財政予算の下で外部ツールを呼び出すことで、大規模言語モデルで多段階のタスクを解決しなければならない。
我々は、意図認識の階層的世界モデルを活用する推論時計画フレームワークINTENTを提案し、将来のツール使用、リスク校正コスト、オンラインのガイド決定を予想する。
- 参考スコア(独自算出の注目度): 20.31276001607449
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study budget-constrained tool-augmented agents, where a large language model must solve multi-step tasks by invoking external tools under a strict monetary budget. We formalize this setting as sequential decision making in context space with priced and stochastic tool executions, making direct planning intractable due to massive state-action spaces, high variance of outcomes and prohibitive exploration cost. To address these challenges, we propose INTENT, an inference-time planning framework that leverages an intention-aware hierarchical world model to anticipate future tool usage, risk-calibrated cost, and guide decisions online. Across cost-augmented StableToolBench, INTENT strictly enforces hard budget feasibility while substantially improving task success over baselines, and remains robust under dynamic market shifts such as tool price changes and varying budgets.
- Abstract(参考訳): 予算制約付きツール強化エージェントについて検討し、厳格な財政予算の下で外部ツールを呼び出すことで、大規模言語モデルで多段階のタスクを解決しなければならない。
我々は、この設定を、価格と確率的なツールの実行を伴うコンテキスト空間におけるシーケンシャルな意思決定として定式化し、大量のステートアクション空間、結果のばらつき、および禁止的な探索コストにより、直接計画が難しくなるようにした。
これらの課題に対処するため,インテリジェンス(INTENT)を提案する。このフレームワークは意図を意識した階層的世界モデルを利用して,将来的なツールの使用,リスク校正コスト,オンライン上の意思決定のガイドを行う。
コスト強化されたStableToolBench全体で、INTENTは厳格な予算実現性を強制し、ベースラインよりもタスクの成功を大幅に改善し、ツールの価格変更やさまざまな予算変更といった動的な市場シフトの下では、引き続き堅牢である。
関連論文リスト
- Learning Query-Aware Budget-Tier Routing for Runtime Agent Memory [56.0946692457838]
BudgetMemは、明示的でクエリ対応のパフォーマンスコスト管理のためのランタイムエージェントメモリフレームワークである。
軽量ルータは、タスク性能とメモリ構築コストのバランスをとるために、モジュール間の予算層ルーティングを実行する。
LoCoMo、LongMemEval、HotpotQAの他、BudgetMemはパフォーマンスが優先されるときに、強力なベースラインを超える。
論文 参考訳(メタデータ) (2026-02-05T18:57:09Z) - Budget-Aware Tool-Use Enables Effective Agent Scaling [82.6942342482552]
大規模言語モデル(LLM)におけるタスク間のテスト時間計算のスケーリングによるパフォーマンス向上
本研究では,これらのエージェントを,Web検索エージェントを中心に,明示的なツールコール予算の下で効果的にスケールする方法について検討する。
私たちは、エージェントに継続的な予算意識を提供する軽量プラグインであるBudget Trackerを紹介します。
論文 参考訳(メタデータ) (2025-11-21T07:18:55Z) - CostBench: Evaluating Multi-Turn Cost-Optimal Planning and Adaptation in Dynamic Environments for LLM Tool-Use Agents [20.07359140801559]
CostBenchは、エージェントの経済的推論と計画能力を評価するために設計されたコスト中心のベンチマークである。
さまざまなカスタマイズ可能なコストで、原子および複合ツールの複数のシーケンスを通じて解決可能なタスクから構成される。
また、ツール障害やコスト変更などの4種類の動的ブロッキングイベントをサポートし、現実世界の予測不能をシミュレートする。
論文 参考訳(メタデータ) (2025-11-04T16:58:29Z) - BudgetThinker: Empowering Budget-aware LLM Reasoning with Control Tokens [33.607723102172194]
BudgetThinkerは、予算を考慮した推論で大規模言語モデルを強化するために設計されたフレームワークである。
我々は、BudgetThinkerが、様々な推論予算におけるパフォーマンス維持において、強力なベースラインをはるかに上回っていることを示す。
論文 参考訳(メタデータ) (2025-08-24T03:17:50Z) - Scalable Chain of Thoughts via Elastic Reasoning [61.75753924952059]
Elastic Reasoningは、スケーラブルな思考の連鎖のための新しいフレームワークである。
推論は、独立して割り当てられた予算で、思考と解決の2つのフェーズに分けられる。
我々のアプローチは、制約のない設定でもより簡潔で効率的な推論をもたらす。
論文 参考訳(メタデータ) (2025-05-08T15:01:06Z) - Query Routing for Homogeneous Tools: An Instantiation in the RAG Scenario [62.615210194004106]
ツール学習に関する現在の研究は、主に様々な選択肢から最も効果的なツールを選択することに焦点を当てており、しばしば費用対効果を見落としている。
本稿では,タスクの達成に必要な性能と関連するコストの両方を予測し,同種ツールの選択に対処する。
論文 参考訳(メタデータ) (2024-06-18T09:24:09Z) - Budget-Constrained Tool Learning with Planning [40.52601704021853]
本稿では,予算制約ツール学習のための新しい手法を提案する。
当社のアプローチでは、ツールを利用する前に、予算制約の下で望ましいプランを作成します。
論文 参考訳(メタデータ) (2024-02-25T02:46:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。