論文の概要: ParaTool: Shifting Tool Representations from Context to Parameters
- arxiv url: http://arxiv.org/abs/2605.29561v1
- Date: Thu, 28 May 2026 08:14:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.054484
- Title: ParaTool: Shifting Tool Representations from Context to Parameters
- Title(参考訳): ParaTool: コンテキストからパラメータへのシフトツール表現
- Authors: Zekai Yu, Qi Meng, Qizhi Chu, Yu Hao, Chuan Shi, Cheng Yang,
- Abstract要約: ParaToolは、各ツールを専用のロード可能なパラメータセットにプロジェクションするフレームワークである。
本手法は,(1)異なるツールの知識を独立したパラメータモジュールにカプセル化するためのパラメトリックツール事前学習,(2)ソフトツールの選択では,関連するツールパラメータを動的に計測・集約するゲーティングネットワーク,(3)ツールパラメータを微調整し,トレーニングと推論プロセスの調整を行う。
- 参考スコア(独自算出の注目度): 21.55999060277199
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tool calling extends large language models (LLMs) by enabling grounded interaction with external executable interfaces, thereby supporting environment-coupled problem solving. However, mainstream in-context learning (ICL) approaches typically incorporate detailed tool documentation and usage examples directly into the context. This results in substantial inference overhead and heightened risks of hallucination as the context length grows. Conversely, while tuning-based methods improve general tool-calling capabilities, they often fail to effectively internalize the specific details of previously seen tools, thereby retaining a dependency on in-context documentation. To address these limitations, we propose ParaTool, a framework that projects each tool into a dedicated, loadable set of parameters. By equipping a dynamic integration of these parameterized tools, the LLM can perform tool calling without relying on in-context documents or examples. Specifically, our approach consists of three stages: (1) parametric tool pre-training encapsulates the knowledge of different tools into independent parameter modules; (2) soft tool selection employs a gating network to dynamically weigh and aggregate relevant tool parameters; and (3) parametric tool fine-tuning jointly updates tool parameters to align the training and inference processes. Experiments on Stable ToolBench and BFCL demonstrate that ParaTool significantly outperforms strong ICL-based baselines, achieving superior performance while reducing computational complexity.
- Abstract(参考訳): ツールコールは、外部実行可能インタフェースとの接地的な相互作用を可能にし、環境に結合した問題解決をサポートすることで、大きな言語モデル(LLM)を拡張する。
しかし、主流のコンテキスト内学習(ICL)アプローチは一般的に、詳細なツールドキュメントや使用例を直接コンテキストに組み込む。
これにより、文脈長が大きくなるにつれて、かなりの推測オーバーヘッドと幻覚のリスクが増大する。
逆に、チューニングベースのメソッドは一般的なツール呼び出し機能を改善するが、前述したツールの特定の詳細を効果的に内部化し、コンテキスト内ドキュメントへの依存性を保持することに失敗することが多い。
これらの制限に対処するために、ParaToolを提案する。ParaToolは、各ツールを専用のロード可能なパラメータセットにプロジェクションするフレームワークである。
これらのパラメータ化ツールを動的に統合することで、LLMはテキスト内文書や例に頼ることなく、ツール呼び出しを実行することができる。
具体的には、(1)パラメトリックツールの事前学習は、異なるツールの知識を独立したパラメータモジュールにカプセル化すること、(2)ソフトツールの選択は、関連するツールパラメータを動的に測定・集約するためにゲーティングネットワークを利用すること、(3)パラメトリックツールの微調整により、トレーニングと推論プロセスの調整を行う。
Stable ToolBenchとBFCLの実験では、ParaToolは強力なICLベースのベースラインを著しく上回り、計算複雑性を低減しながら優れたパフォーマンスを実現している。
関連論文リスト
- Learning to Rewrite Tool Descriptions for Reliable LLM-Agent Tool Use [21.666294374943178]
トレースリッチな設定からトレースフリーなデプロイメントへ監督を移行するカリキュラム学習フレームワークを提案する。
実験では、予期せぬツール、強力なクロスドメインの一般化、そして、候補ツールの数が100を超えるほど堅牢性に一貫した向上が示されている。
論文 参考訳(メタデータ) (2026-02-23T23:50:24Z) - AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning [66.24374176797075]
textbfAdaReasonerは、ツール固有の、あるいは明示的な教師付き行動ではなく、一般的な推論スキルとしてツールの使用を学ぶマルチモーダルモデルのファミリーである。
AdaReasonerは、(i)スケーラブルなデータキュレーションパイプラインによって、長期にわたる多段階のツールインタラクションにモデルを公開し、(ii)ツール-GRPO、(ii)ツールの選択とシークエンシングをエンドツーエンドの成功に基づいて優先順位付けする強化学習アルゴリズム、(iii)ツールの使用を動的に規制する適応学習メカニズムによって実現されている。
論文 参考訳(メタデータ) (2026-01-26T16:04:43Z) - Teaching LLMs to Learn Tool Trialing and Execution through Environment Interaction [31.689383152872534]
ToolMasterは、ツールの使用を黄金のツール呼び出しトラジェクトリの模倣から、環境とのインタラクションを通じてツールの使用を積極的に学習するフレームワークである。
ツール計画と実行のためにLLMを最適化するために、ToolMasterはトライアルと実行のパラダイムを採用している。
実験の結果、ツールマスターは、見知らぬツールや馴染みのないツールをまたいだ一般化や堅牢性という点で、既存のベースラインを著しく上回ります。
論文 参考訳(メタデータ) (2026-01-19T06:46:33Z) - Advancing and Benchmarking Personalized Tool Invocation for LLMs [66.39214525683425]
パーソナライズされたツール呼び出しの概念を導入し、ツールの優先度とプロファイルに依存したクエリという2つの重要なタスクを定義します。
これらの課題に対処するために、パーソナライズされたツール呼び出し用に設計されたデータ合成フレームワークであるPToolを提案する。
パーソナライズされたツール呼び出しを評価するための最初のベンチマークである textbfPTBench を構築した。
論文 参考訳(メタデータ) (2025-05-07T02:25:20Z) - Towards Completeness-Oriented Tool Retrieval for Large Language Models [60.733557487886635]
現実世界のシステムは多種多様なツールを組み込んでおり、全てのツールを大規模言語モデルに入力することは不可能である。
既存のツール検索手法は主にユーザクエリとツール記述間のセマンティックマッチングに焦点を当てている。
我々は,ユーザクエリとツール記述のセマンティックな類似性だけでなく,ツールの協調的情報も考慮した,新しいモデル診断型協調学習型ツール検索手法であるCOLTを提案する。
論文 参考訳(メタデータ) (2024-05-25T06:41:23Z) - ControlLLM: Augment Language Models with Tools by Searching on Graphs [97.62758830255002]
我々は,大規模言語モデル(LLM)が実世界のタスクを解くためのマルチモーダルツールを利用できる新しいフレームワークであるControlLLMを提案する。
フレームワークは,(1)複雑なタスクを明確なサブタスクに分割し,入力と出力を適切に定義したサブタスクに分解するtextittask Decomposer,(2)構築済みのツールグラフ上で最適なソリューションパスを探索する textitThoughts-on-Graph(ToG)パラダイム,(3)ソリューションパスを解釈して実行するリッチなツールボックスを備えた textitexecution Engine,の3つの主要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-10-26T21:57:21Z) - Don't Fine-Tune, Decode: Syntax Error-Free Tool Use via Constrained Decoding [11.51687663492722]
大きな言語モデル(LLM)は多くのタスクで優れていますが、複雑な構文制約のため、外部ツールの使用に失敗することが多いのです。
本研究では,有限状態マシンを用いた復号アルゴリズムTOOLDECを提案する。
実験の結果、TOOLDECはすべての構文エラーを排除し、様々なベースモデルやベンチマークのパフォーマンスが大幅に向上した。
論文 参考訳(メタデータ) (2023-10-10T23:37:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。