論文の概要: NTILC: Neural Tool Invocation via Learned Compression
- arxiv url: http://arxiv.org/abs/2606.06566v1
- Date: Thu, 04 Jun 2026 17:27:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.379415
- Title: NTILC: Neural Tool Invocation via Learned Compression
- Title(参考訳): NTILC:学習圧縮によるニューラルツールの実行
- Authors: Andrew Krikorian, Yayuan Li, Jason J. Corso,
- Abstract要約: NTILCは、コンテキスト内レジストリのルックアップを学習された潜時検索に置き換える、ニューラルネットワークツールの選択と実行のためのフレームワークである。
NTILCは、ユーザインテントとツール仕様の両方を共有埋め込みスペースにマッピングし、コンテキスト内ルックアップではなく、外部検索によるツール選択を可能にする。
NTILCを公開ツール選択および関数呼び出しデータセット上で評価し、コンテキストトークンの使用状況、検索精度、選択遅延メトリクスを報告する。
- 参考スコア(独自算出の注目度): 11.14872687699571
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agentic tool-calling language models depend on large registries of callable APIs, functions, and local actions. Placing full tool specifications directly in the prompt incurs a cost that scales linearly with the size of the tool registry, rapidly consuming the context budget. As the registry grows, this leads to higher latency and degrades selection accuracy, particularly due to interference from irrelevant tools. We overcome these limitations by introducing NTILC, a neural tool selection and invocation framework that replaces in-context registry look-up with learned latent retrieval. NTILC maps both user intent and tool specifications into a shared embedding space, enabling tool selection via external retrieval rather than in-context lookup. The language model is conditioned only on the selected tool schema, allowing for precise, constrained argument generation. Central to our approach is a signature-aware composite objective, which augments semantic similarity with constraints derived from tool signatures (e.g., argument schema, type compatibility, and return types). By combining Circle Loss with a Functional Margin Loss, the model enforces separation between tools that are semantically similar but incompatible under their execution signatures. We evaluate NTILC on public tool-selection and function-calling datasets and report context token usage, retrieval accuracy, and selection latency metrics. Across these settings, NTILC reduces context window consumption by over 95% and inference latency by up to 74% compared to long-context ICT baselines.
- Abstract(参考訳): エージェントツール呼び出し言語モデルは、呼び出し可能なAPI、関数、ローカルアクションの大規模なレジストリに依存します。
プロンプトに完全なツール仕様を直接配置することは、ツールレジストリのサイズと線形にスケールするコストを発生させ、コンテキスト予算を急速に消費する。
レジストリが大きくなると、特に無関係なツールからの干渉により、レイテンシが高くなり、選択の精度が低下する。
NTILCは、コンテキスト内レジストリのルックアップを学習潜時検索に置き換えるニューラルネットワークツールの選択と実行のためのフレームワークです。
NTILCは、ユーザインテントとツール仕様の両方を共有埋め込みスペースにマッピングし、コンテキスト内ルックアップではなく、外部検索によるツール選択を可能にする。
言語モデルは選択したツールスキーマにのみ条件付けされており、厳密な制約付き引数生成を可能にする。
私たちのアプローチの中心は、ツールシグネチャ(例えば、引数スキーマ、型互換性、戻り型)から派生した制約と意味的類似性を高めるシグネチャ対応の複合目的である。
Circle LossとFunctional Margin Lossを組み合わせることで、モデルはセマンティックに類似しているが、実行シグネチャでは互換性のないツールを分離する。
NTILCを公開ツール選択および関数呼び出しデータセット上で評価し、コンテキストトークンの使用状況、検索精度、選択遅延メトリクスを報告する。
これらの設定全体で、NTILCはコンテキストウィンドウの消費を95%以上削減し、長文ICTベースラインと比較して推論遅延を最大74%削減する。
関連論文リスト
- ParaTool: Shifting Tool Representations from Context to Parameters [21.55999060277199]
ParaToolは、各ツールを専用のロード可能なパラメータセットにプロジェクションするフレームワークである。
本手法は,(1)異なるツールの知識を独立したパラメータモジュールにカプセル化するためのパラメトリックツール事前学習,(2)ソフトツールの選択では,関連するツールパラメータを動的に計測・集約するゲーティングネットワーク,(3)ツールパラメータを微調整し,トレーニングと推論プロセスの調整を行う。
論文 参考訳(メタデータ) (2026-05-28T08:14:07Z) - JTPRO: A Joint Tool-Prompt Reflective Optimization Framework for Language Agents [34.99316717979429]
JTPRO(Joint Tool-Promptive Optimization)は,Trace-20%設定におけるツール・プロンプティブ最適化を改善するためのフレームワークである。
ツール選択精度(TSA)、スロット充足精度(SFA)、総合成功率(OSR)(正しいツール+正しいスロット+正しい値)の3つの指標を用いて、マルチツールベンチマーク間でJTPROを評価した。
論文 参考訳(メタデータ) (2026-04-20T05:37:43Z) - ForgeryVCR: Visual-Centric Reasoning via Efficient Forensic Tools in MLLMs for Image Forgery Detection and Localization [62.03035862528452]
ForgeryVCRは、視覚中心推論(Visual-Centric Reasoning)を通じて、知覚できないトレースを明示的な視覚中間体に物質化するフレームワークである。
ForgeryVCRは、検出タスクとローカライゼーションタスクの両方において、最先端(SOTA)のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-02-15T11:14:47Z) - Simulating Complex Multi-Turn Tool Calling Interactions in Stateless Execution Environments [14.539418822648658]
DiGiT-TCは、ステートフルな環境で検索によって生成された会話の特徴を持つ会話を呼び出すツールを作成するように設計されている。
標準ツール呼び出しベンチマークに対する我々のアプローチを検証するとともに、ステートフルな問題設定においても、我々のアプローチはパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2026-01-06T20:04:30Z) - Re-Initialization Token Learning for Tool-Augmented Large Language Models [49.91503552002649]
大規模言語モデルは例外的な性能を示してきたが、数値推論や計画生成といった複雑なタスクに苦戦している。
本稿では,ツールトークンを既存の単語埋め込み空間と整合させる新しいトークン学習手法を提案する。
本稿では,GSM8K-XL,FuncQA,KAMEL,VirtualHomeのデータセットを用いて,数値推論,知識に基づく質問応答,具体化計画生成などのタスクについて評価する。
論文 参考訳(メタデータ) (2025-06-17T07:11:00Z) - Advancing and Benchmarking Personalized Tool Invocation for LLMs [66.39214525683425]
パーソナライズされたツール呼び出しの概念を導入し、ツールの優先度とプロファイルに依存したクエリという2つの重要なタスクを定義します。
これらの課題に対処するために、パーソナライズされたツール呼び出し用に設計されたデータ合成フレームワークであるPToolを提案する。
パーソナライズされたツール呼び出しを評価するための最初のベンチマークである textbfPTBench を構築した。
論文 参考訳(メタデータ) (2025-05-07T02:25:20Z) - Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger [49.81945268343162]
我々は,外部ツール利用のための適応型意思決定戦略であるMeCoを提案する。
MeCoは、表現空間内の高レベル認知信号をキャプチャすることで、メタ認知スコアを定量化する。
MeCoは微調整不要で、最小限のコストがかかる。
論文 参考訳(メタデータ) (2025-02-18T15:45:01Z) - FREYR: A Framework for Recognizing and Executing Your Requests [2.4797200957733576]
本稿では、ツールの使用プロセスを別のステップにモジュール化する合理化フレームワークであるFREYRを紹介する。
FREYRは従来のツール使用法に比べて優れた性能を示す。
我々はFREYRをゲームデザインに特化した実世界のテストケースのセットで評価し、Ollama APIが提供する従来のツール使用法と比較した。
論文 参考訳(メタデータ) (2025-01-21T11:08:18Z) - ControlLLM: Augment Language Models with Tools by Searching on Graphs [97.62758830255002]
我々は,大規模言語モデル(LLM)が実世界のタスクを解くためのマルチモーダルツールを利用できる新しいフレームワークであるControlLLMを提案する。
フレームワークは,(1)複雑なタスクを明確なサブタスクに分割し,入力と出力を適切に定義したサブタスクに分解するtextittask Decomposer,(2)構築済みのツールグラフ上で最適なソリューションパスを探索する textitThoughts-on-Graph(ToG)パラダイム,(3)ソリューションパスを解釈して実行するリッチなツールボックスを備えた textitexecution Engine,の3つの主要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-10-26T21:57:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。