論文の概要: Online-Optimized RAG for Tool Use and Function Calling
- arxiv url: http://arxiv.org/abs/2509.20415v2
- Date: Fri, 26 Sep 2025 03:20:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 12:12:20.342119
- Title: Online-Optimized RAG for Tool Use and Function Calling
- Title(参考訳): ツールと関数呼び出しのためのオンライン最適化RAG
- Authors: Yu Pan, Xiaocheng Li, Hanzhao Wang,
- Abstract要約: 検索拡張生成(RAG)は、事前に指定されたツール/機能記述にユーザクエリを埋め込むことで、ツールの使用と関数呼び出しを駆動する。
Online-d RAGは、最小限のフィードバックを使用して、ライブインタラクションからの検索埋め込みに適応する。
- 参考スコア(独自算出の注目度): 10.294181998196555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many applications, retrieval-augmented generation (RAG) drives tool use and function calling by embedding the (user) queries and matching them to pre-specified tool/function descriptions. In this paper, we address an embedding misalignment issue that often arises in practical applications due to imperfect embedding models or noisy descriptions; such misalignment may lead to incorrect retrieval and task failure. We introduce Online-Optimized RAG, a deployment-time framework that continually adapts retrieval embeddings from live interactions using minimal feedback (e.g., task success). Online-Optimized RAG applies lightweight online gradient updates with negligible per-query latency and requires no changes to the underlying LLM. The method is plug-and-play: it supports both single- and multi-hop tool use, dynamic tool inventories, and $K$-retrieval with re-ranking. We provide a problem-dependent theoretical analysis that quantifies how the method's performance depends on the initialization quality of the embeddings and other related quantities. Across diverse tool-use and document-retrieval scenarios, our Online-Optimized RAG consistently improves tool selection accuracy and end-task success, thus providing a simple, practical path to robust, self-improving RAG systems.
- Abstract(参考訳): 多くのアプリケーションにおいて、検索拡張生成(RAG)は、ツールの使用と機能呼び出しを(ユーザ)クエリを埋め込んで、事前に指定されたツール/機能記述にマッチさせることによって駆動する。
本稿では,不完全な組込みモデルやノイズ記述などにより,実用上しばしば発生する組込みミスアライメントの問題に対処する。
我々は,最小限のフィードバック(タスク成功など)を用いて,ライブインタラクションからの検索埋め込みを継続的に適応するデプロイ時フレームワークであるOnline-Optimized RAGを紹介する。
オンライン最適化RAGは、最小限のクエリ毎のレイテンシで軽量なオンライン勾配更新を適用し、基盤となるLLMを変更する必要はない。
このメソッドはプラグイン・アンド・プレイで、シングルホップツールとマルチホップツールの両方の使用、動的ツールの在庫、そして再ランク付けされた$K$-retrievalをサポートする。
本稿では,本手法の性能が埋め込み等の初期化品質にどのように依存するかを定量化する問題依存理論解析法を提案する。
多様なツール利用とドキュメント検索のシナリオにおいて、オンライン最適化RAGはツールの選択精度とエンドタスクの成功を一貫して改善し、堅牢で自己改善的なRAGシステムへのシンプルで実践的なパスを提供します。
関連論文リスト
- Tool-R1: Sample-Efficient Reinforcement Learning for Agentic Tool Use [50.02614257515131]
大規模言語モデル(LLM)は、言語理解と推論において強力な能力を示している。
本稿では,LLMの汎用的,構成的,多段階的なツール使用を可能にする強化学習フレームワークであるTool-R1を提案する。
論文 参考訳(メタデータ) (2025-09-16T09:22:21Z) - FamilyTool: A Multi-hop Personalized Tool Use Benchmark [93.80355496575281]
FamilyToolは、パーソナライズされたマルチホップツールの使用シナリオをシミュレートする、家族ベースのナレッジグラフ(KG)に基盤を置くベンチマークである。
実験により、最先端の大規模言語モデル(LLM)における顕著な性能ギャップが明らかになった
FamilyToolは、複雑な動的環境において、LLMエージェントの推論、適応性、スケーラビリティを評価し、前進するための重要なリソースとなる。
論文 参考訳(メタデータ) (2025-04-09T10:42:36Z) - Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger [49.81945268343162]
我々は,外部ツール利用のための適応型意思決定戦略であるMeCoを提案する。
MeCoは、表現空間内の高レベル認知信号をキャプチャすることで、メタ認知スコアを定量化する。
MeCoは微調整不要で、最小限のコストがかかる。
論文 参考訳(メタデータ) (2025-02-18T15:45:01Z) - Fast or Better? Balancing Accuracy and Cost in Retrieval-Augmented Generation with Flexible User Control [52.405085773954596]
Retrieval-Augmented Generationは、大規模な言語モデル幻覚を緩和するための強力なアプローチとして登場した。
既存のRAGフレームワークは、しばしば無差別に検索を適用し、非効率な再検索につながる。
本稿では,精度・コストのトレードオフを動的に調整できる新しいユーザ制御可能なRAGフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:56:20Z) - FREYR: A Framework for Recognizing and Executing Your Requests [2.4797200957733576]
本稿では、ツールの使用プロセスを別のステップにモジュール化する合理化フレームワークであるFREYRを紹介する。
FREYRは従来のツール使用法に比べて優れた性能を示す。
我々はFREYRをゲームデザインに特化した実世界のテストケースのセットで評価し、Ollama APIが提供する従来のツール使用法と比較した。
論文 参考訳(メタデータ) (2025-01-21T11:08:18Z) - Don't Do RAG: When Cache-Augmented Generation is All You Need for Knowledge Tasks [11.053340674721005]
検索拡張世代(RAG)は,外部知識ソースを統合することで言語モデルを強化する強力なアプローチとして注目されている。
本稿では、リアルタイム検索をバイパスする代替パラダイムであるキャッシュ拡張生成(CAG)を提案する。
論文 参考訳(メタデータ) (2024-12-20T06:58:32Z) - Efficient and Scalable Estimation of Tool Representations in Vector Space [34.767193045989515]
ツール検索のための合成データを生成するためのフレームワークと,小型エンコーダモデルを用いた効率的なデータ駆動型ツール検索戦略を提案する。
ToolBankは、実際のユーザ利用を反映した、新しいツール検索データセットです。
これらの新しい方法により、ToolBenchデータセット上のRecall@Kで最大27.28、ToolBank上のRecall@Kで30.5の改善を実現しています。
論文 参考訳(メタデータ) (2024-09-02T19:39:24Z) - Planning and Editing What You Retrieve for Enhanced Tool Learning [31.963485987789852]
本稿では,Planning, Learning, and Understanding for TOols(P&R)とEdit-and-Ground(E&G)のパラダイムを取り入れた新しいPLUTO(Planning, Learning, and Understanding for TOols)アプローチを提案する。
実験の結果、これらのパラダイムはツール検索タスクにおけるリコールとNDCGを大幅に改善し、現在の最先端モデルを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-03-30T18:41:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。