論文の概要: Tool Retrieval Bridge: Aligning Vague Instructions with Retriever Preferences via Bridge Model
- arxiv url: http://arxiv.org/abs/2604.07816v1
- Date: Thu, 09 Apr 2026 05:15:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.712646
- Title: Tool Retrieval Bridge: Aligning Vague Instructions with Retriever Preferences via Bridge Model
- Title(参考訳): ツール検索用ブリッジ:橋梁モデルによるレトリバー設定によるVag命令の調整
- Authors: Kunfeng Chen, Luyao Zhuang, Fei Liao, Juhua Liu, Jian Wang, Bo Du,
- Abstract要約: あいまいな指示に対するツール検索性能を向上させるため, 簡易なツール検索橋(TRB)手法を提案する。
TRBの助けを借りて、BM25は111.51%までの相対的な改善を実現し、平均NDCGスコアは9.73から19.59に増加した。
- 参考スコア(独自算出の注目度): 34.10139051040666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tool learning has emerged as a promising paradigm for large language models (LLMs) to address real-world challenges. Due to the extensive and irregularly updated number of tools, tool retrieval for selecting the desired tool subset is essential. However, current tool retrieval methods are usually based on academic benchmarks containing overly detailed instructions (e.g., specific API names and parameters), while real-world instructions are more vague. Such a discrepancy would hinder the tool retrieval in real-world applications. In this paper, we first construct a new benchmark, VGToolBench, to simulate human vague instructions. Based on this, we conduct a series of preliminary analyses and find that vague instructions indeed damage the performance of tool retrieval. To this end, we propose a simple-yet-effective Tool Retrieval Bridge (TRB) approach to boost the performance of tool retrieval for vague instructions. The principle of TRB is to introduce a bridge model to rewrite the vague instructions into more specific ones and alleviate the gap between vague instructions and retriever preferences.We conduct extensive experiments under multiple commonly used retrieval settings, and the results show that TRB effectively mitigates the ambiguity of vague instructions while delivering consistent and substantial improvements across all baseline retrievers. For example, with the help of TRB, BM25 achieves a relative improvement of up to 111.51%, i.e., increasing the average NDCG score from 9.73 to 19.59. The source code and models are publicly available at https://github.com/kfchenhn/TRB.
- Abstract(参考訳): ツール学習は,大規模言語モデル(LLM)が現実の課題に対処するための,有望なパラダイムとして登場した。
広範囲で不規則に更新されたツールのため、望ましいツールサブセットを選択するためのツール検索が不可欠である。
しかし、現在のツール検索手法は通常、過剰に詳細な命令(例えば、特定のAPI名やパラメータ)を含む学術ベンチマークに基づいており、実際の命令はより曖昧である。
このような不一致は、現実世界のアプリケーションにおけるツール検索を妨げます。
本稿では,人間のあいまいな指示をシミュレートするために,まず新しいベンチマークであるVGToolBenchを構築した。
そこで我々は,一連の予備分析を行い,あいまいな指示がツール検索の性能を損なうことを発見した。
そこで本研究では,ツール検索の性能向上を図るため,シンプルなツール検索用ブリッジ(TRB)を提案する。
TRBの原理は、あいまいな命令を具体化して、あいまいな命令とレトリバーの選好のギャップを緩和するブリッジモデルを導入し、複数の一般的な検索設定の下で広範囲な実験を行い、TRBが曖昧な命令のあいまいさを効果的に軽減し、全てのベースラインレトリバーに一貫性と実質的な改善を施すことである。
例えば、TBBの助けを借りて、BM25は111.51%までの相対的な改善を実現し、平均NDCGスコアは9.73から19.59に増加した。
ソースコードとモデルはhttps://github.com/kfchenhn/TRB.comで公開されている。
関連論文リスト
- Tool-R1: Sample-Efficient Reinforcement Learning for Agentic Tool Use [50.02614257515131]
大規模言語モデル(LLM)は、言語理解と推論において強力な能力を示している。
本稿では,LLMの汎用的,構成的,多段階的なツール使用を可能にする強化学習フレームワークであるTool-R1を提案する。
論文 参考訳(メタデータ) (2025-09-16T09:22:21Z) - MassTool: A Multi-Task Search-Based Tool Retrieval Framework for Large Language Models [45.63804847907601]
MassToolは、クエリ表現とツール検索の精度を向上させるために設計されたマルチタスク検索ベースのフレームワークである。
関数呼び出しの必要性を予測するツール使用検知塔と、クエリ中心のグラフ畳み込みネットワーク(QC-GCN)を活用して効率的なクエリツールマッチングを行うツール検索塔である。
MassToolは、ツール使用の検出損失、リストワイズ検索損失、コントラスト正規化損失を共同で最適化することにより、厳密なクエリ理解のための堅牢な2段階のシーケンシャル意思決定パイプラインを確立する。
論文 参考訳(メタデータ) (2025-07-01T07:02:26Z) - Efficient and Scalable Estimation of Tool Representations in Vector Space [34.767193045989515]
ツール検索のための合成データを生成するためのフレームワークと,小型エンコーダモデルを用いた効率的なデータ駆動型ツール検索戦略を提案する。
ToolBankは、実際のユーザ利用を反映した、新しいツール検索データセットです。
これらの新しい方法により、ToolBenchデータセット上のRecall@Kで最大27.28、ToolBank上のRecall@Kで30.5の改善を実現しています。
論文 参考訳(メタデータ) (2024-09-02T19:39:24Z) - Re-Invoke: Tool Invocation Rewriting for Zero-Shot Tool Retrieval [47.81307125613145]
Re-Invokeは、トレーニングなしで大規模ツールセットに効果的にスケールするために設計された教師なしツール検索手法である。
我々は、クエリ毎に最も関連性の高いツールを特定するために、意図に基づいて、新しいマルチビュー類似度ランキング戦略を採用する。
評価の結果、Re-Invokeはシングルツールとマルチツールの両方のシナリオにおいて、最先端の代替よりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-03T22:49:27Z) - Enhancing Tool Retrieval with Iterative Feedback from Large Language Models [9.588592185027455]
大規模言語モデル(LLM)は、コンテキスト内学習や微調整を通じて、ある程度のツールを効果的に扱うことができる。
現実のシナリオでは、ツールの数は一般的に広範囲で不規則に更新され、専用のツール検索コンポーネントの必要性を強調している。
本稿では,大規模言語モデルからの反復的なフィードバックでツール検索を強化することを提案する。
論文 参考訳(メタデータ) (2024-06-25T11:12:01Z) - ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world
APIs [104.37772295581088]
オープンソースの大規模言語モデル(LLM)、例えばLLaMAは、ツール使用能力に大きく制限されている。
データ構築、モデルトレーニング、評価を含む汎用ツールであるToolLLMを紹介する。
ツール使用のためのインストラクションチューニングフレームワークであるToolBenchを,ChatGPTを使って自動構築する。
論文 参考訳(メタデータ) (2023-07-31T15:56:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。