論文の概要: HTAA: Enhancing LLM Planning via Hybrid Toolset Agentization & Adaptation
- arxiv url: http://arxiv.org/abs/2604.10917v1
- Date: Mon, 13 Apr 2026 02:33:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.280998
- Title: HTAA: Enhancing LLM Planning via Hybrid Toolset Agentization & Adaptation
- Title(参考訳): HTAA:ハイブリッドツールセットのエージェント化と適応によるLCM計画の強化
- Authors: Chengrui Huang, Junshuo Zhang, Zhiyuan Ma, Xikun Wang, Ximeng Wang, Menghua Jiang, Gang Zeng, Zhaobing Han, Shen Gao, Shuo Shang,
- Abstract要約: Hybrid Toolset Agentization & Adaptation (HTAA)は、スケーラブルなツール利用計画のための階層的なフレームワークである。
本稿では,頻繁に使用されるツールを特殊なエージェントツールにカプセル化する,新しいツールセットエージェント化パラダイムを提案する。
私たちは、中国最大のオンライン大規模配車プラットフォームのPOI検証ワークフローに基づいて、実世界の内部データセットであるInfoVerifyで実験を行います。
- 参考スコア(独自算出の注目度): 33.91421362668113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Enabling large language models to scale and reliably use hundreds of tools is critical for real-world applications, yet challenging due to the inefficiency and error accumulation inherent in flat tool-calling architectures. To address this, we propose Hybrid Toolset Agentization & Adaptation (HTAA), a hierarchical framework for scalable tool-use planning. We propose a novel toolset agentization paradigm, which encapsulates frequently co-used tools into specialized agent tools, thereby reducing the planner's action space and mitigating redundancy. To ensure effective coordination, we design Asymmetric Planner Adaptation, a trajectory-based training paradigm that aligns the high-level planner with agent tools via backward reconstruction and forward refinement. To validate the performance of HTAA, we conduct experiments on a real-world internal dataset, InfoVerify, based on the POI validation workflow of China's largest online large-scale ride-hailing platform, featuring long-horizon executable tool trajectories. Experiments on InfoVerify and widely-used benchmarks show that HTAA consistently achieves higher task success rates, requires short tool calling trajectories, and significantly reduces context overhead compared to strong baselines. Furthermore, in a production deployment, HTAA substantially reduces manual validation effort and operational cost, demonstrating its practical efficacy.
- Abstract(参考訳): 大規模言語モデルを導入して数百のツールを確実に使用することは、現実世界のアプリケーションにとって非常に重要なことですが、フラットなツール呼び出しアーキテクチャに固有の非効率性とエラーの蓄積のため、難しいのです。
そこで我々は,Hybrid Toolset Agentization & Adaptation (HTAA)を提案する。
本稿では,頻繁に使用されるツールを特殊なエージェントツールにカプセル化することで,プランナーの動作空間を小さくし,冗長性を緩和する新しいツールセットエージェント化パラダイムを提案する。
効果的な協調を確保するために,後方再構成と前方修正によるエージェントツールと高レベルプランナーを整合させる軌道ベーストレーニングパラダイムである非対称プランナー適応を設計する。
HTAAの性能を検証するため,中国最大のオンライン大規模配車プラットフォームのPOI検証ワークフローに基づいて,実世界の内部データセットであるInfoVerifyの実験を行った。
InfoVerifyおよび広く使用されているベンチマークの実験では、HTAAはタスクの成功率を一貫して達成し、短いツール呼び出しトラジェクトリを必要とし、強いベースラインに比べてコンテキストオーバーヘッドを著しく低減している。
さらに、本運用では、HTAAは手作業による検証作業と運用コストを大幅に削減し、実用性を示す。
関連論文リスト
- PEARL: Plan Exploration and Adaptive Reinforcement Learning for Multihop Tool Use [10.58323565531902]
大規模な言語モデルは、外部ツールには大きな可能性を秘めていますが、複雑なマルチターンツールの実行において、大きな課題に直面しています。
我々は、高度なツール使用のためのLSM計画と実行を強化する新しいフレームワークであるPEARLを提案する。
ToolHopとT-Evalベンチマークの実験では、PEARLは既存の手法よりも大幅に優れており、ToolHopで新しい最先端の成功率である textbf56.5% を達成し、低呼び出しエラー率を維持している。
論文 参考訳(メタデータ) (2026-01-28T09:49:43Z) - ML-Tool-Bench: Tool-Augmented Planning for ML Tasks [23.54937738755734]
ツール強化機械学習エージェントの評価のためのベンチマークを導入する。
私たちのベンチマークは、インメモリ名のオブジェクト管理を組み込むことで、従来のツール使用の評価を超えています。
我々のアプローチはReActよりも16.2%向上し、すべてのKaggle課題の中央値を取ります。
論文 参考訳(メタデータ) (2025-11-29T23:59:40Z) - GAP: Graph-Based Agent Planning with Parallel Tool Use and Reinforcement Learning [20.75113227786218]
グラフベースのエージェント計画(GAP)は、グラフベースの計画を通じてタスク間の依存関係を明示的にモデル化する新しいフレームワークである。
我々のアプローチは、複雑なタスクを依存性を意識したサブタスクグラフに分解する基礎モデルを訓練する。
この依存性を意識したオーケストレーションは、実行効率とタスクの正確性の両方で大幅に改善される。
論文 参考訳(メタデータ) (2025-10-29T09:35:55Z) - Tool-R1: Sample-Efficient Reinforcement Learning for Agentic Tool Use [50.02614257515131]
大規模言語モデル(LLM)は、言語理解と推論において強力な能力を示している。
本稿では,LLMの汎用的,構成的,多段階的なツール使用を可能にする強化学習フレームワークであるTool-R1を提案する。
論文 参考訳(メタデータ) (2025-09-16T09:22:21Z) - Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments [70.42705564227548]
大規模言語モデル(LLM)のための環境自動構築パイプラインを提案する。
これにより、外部ツールに頼ることなく、詳細な測定可能なフィードバックを提供する高品質なトレーニング環境の作成が可能になる。
また、ツール使用の精度とタスク実行の完全性の両方を評価する検証可能な報酬機構も導入する。
論文 参考訳(メタデータ) (2025-08-12T09:45:19Z) - LAM SIMULATOR: Advancing Data Generation for Large Action Model Training via Online Exploration and Trajectory Feedback [121.78866929908871]
AIエージェントのための大規模アクションモデル(LAM)は、素晴らしいポテンシャルを提供するが、高品質なトレーニングデータを必要とするため、課題に直面している。
LAM SIMULATORは,高品質なフィードバックによるエージェントタスクのオンライン探索を目的とした総合的なフレームワークである。
本フレームワークは,動的タスククエリジェネレータ,広範囲なツールコレクション,および大規模言語モデル(LLM)エージェントがツールを呼び出し,リアルタイムフィードバックを受信できる対話型環境を備えている。
論文 参考訳(メタデータ) (2025-06-02T22:36:02Z) - Acting Less is Reasoning More! Teaching Model to Act Efficiently [87.28134636548705]
ツール統合推論は、タスクを解決するために外部ツールを呼び出す機能によって、大きな言語モデルを拡張します。
現在のアプローチは、外部ツールの使用効率や必要性を考慮せずに、最終的な正確性のためにのみ最適化されている。
最小限のツールコールで正確な回答をモデルに提示するフレームワークを提案する。
このアプローチでは,ツールコールを最大68.3%削減し,ツールの生産性を最大215.4%向上すると同時に,同等の回答精度を維持している。
論文 参考訳(メタデータ) (2025-04-21T05:40:05Z) - Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios [93.68764280953624]
UltraToolは、ツール利用におけるLarge Language Modelsの能力を改善し評価するために設計された、新しいベンチマークである。
現実の複雑さを強調し、効果的な問題解決のために正確で多段階の計画を必要とする。
UltraToolの重要な特徴は、ツールの使用前に発生する自然言語による計画の独立した評価である。
論文 参考訳(メタデータ) (2024-01-30T16:52:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。