論文の概要: ToolWeave: Structured Synthesis of Complex Multi-Turn Tool-Calling Dialogues
- arxiv url: http://arxiv.org/abs/2605.12521v1
- Date: Fri, 03 Apr 2026 17:02:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.780746
- Title: ToolWeave: Structured Synthesis of Complex Multi-Turn Tool-Calling Dialogues
- Title(参考訳): ツールウィービング:複合多軸ツールカーリング対話の構造的合成
- Authors: Dinesh Khandelwal, Gnana Prakash Punnavajhala, GPS Bhargav, Gaurav Pandey, Sachin Joshi, Hima Karanam, Dinesh Raghu,
- Abstract要約: LLMが自律エージェントとして機能するためには、マルチターンツールコールが不可欠である。
既存の合成データ生成パイプラインは非現実的な対話を生成する。
リアルなマルチターンツールコールを合成するための構造化フレームワークであるToolWeaveを紹介する。
- 参考スコア(独自算出の注目度): 17.032111974825185
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-turn tool calling is essential for LLMs to function as autonomous agents, yet synthesizing the training data required for these capabilities remains a fundamental challenge. Existing synthetic data generation pipelines often produce unrealistic dialogues for two reasons: they chain tools that are only superficially compatible rather than aligned with meaningful user tasks, and they generate dialogues in one shot, which often introduces arguments that were neither provided by the user nor produced by prior tool calls. These issues also lead to a severe underrepresentation of multi-step tool interactions. We introduce ToolWeave, a structured framework for synthesizing realistic multi-turn tool-calling dialogues. ToolWeave support realistic multi-step workflows (or tool sequences) by constructing tools with built-in dependencies and filters the workflows based on alignment with user goals. It reduces parameter hallucination by using a fine-grained planning stage that explicitly tracks parameter provenance. As a result, ToolWeave-generated synthetic dialogues contain more multi-step tool interactions (45%) and fewer hallucinations in parameters and tool names. Consequently, LLMs fine-tuned on ToolWeave consistently outperform those fine-tuned on prior datasets across three public benchmarks. Notably, Llama-3.1-70B fine-tuned on ToolWeave achieves 39.75% on BFCL-V3 multi-turn, compared to 23.50% when fine-tuned on SOTA ToolFlow data.
- Abstract(参考訳): LLMが自律的なエージェントとして機能するためには、マルチターンツールコールが不可欠だが、これらの機能に必要なトレーニングデータを合成することは、依然として根本的な課題である。
既存の合成データ生成パイプラインは、2つの理由から非現実的な対話を生成することが多い。それらは、意味のあるユーザタスクと整合するのではなく、表面的に互換性のあるツールのみをチェーンし、ワンショットで対話を生成する。
これらの問題はまた、多段階のツールインタラクションの深刻な過小評価にも繋がる。
リアルなマルチターンツールコール対話を合成するための構造化フレームワークであるToolWeaveを紹介する。
ToolWeaveは、組み込みの依存関係を持つツールを構築し、ユーザ目標との整合性に基づいてワークフローをフィルタリングすることによって、現実的なマルチステップワークフロー(あるいはツールシーケンス)をサポートする。
パラメータの発散を明示的に追跡するきめ細かい計画段階を使用することで、パラメータの幻覚を低減する。
その結果、ToolWeaveの生成した合成対話には、より多段階のツールインタラクション(45%)と、パラメータやツール名に対する幻覚の減少が含まれている。
結果として、ToolWeaveで微調整されたLLMは、3つの公開ベンチマークで以前のデータセットで微調整されたものよりも一貫して優れています。
特に、ToolWeaveで微調整されたLlama-3.1-70BはBFCL-V3マルチターンで39.75%、SOTA ToolFlowのデータで微調整された場合は23.50%である。
関連論文リスト
- FinToolSyn: A forward synthesis Framework for Financial Tool-Use Dialogue Data with Dynamic Tool Retrieval [59.67674731525128]
FinToolSynは、高品質な財務対話を生成するために設計された前方合成フレームワークである。
パイプラインは43,066のツールのリポジトリを構築し、148万以上の対話インスタンスを合成する。
大規模な実験により、FinToolSynでトレーニングされたモデルは21.06%改善された。
論文 参考訳(メタデータ) (2026-03-25T08:00:26Z) - Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text [48.25052564552558]
本稿では,テキストコーパスから多ターンツール利用トラジェクトリの生成と抽出を可能にするデータ合成パイプラインであるGEMを紹介する。
計算コストを削減するため,教師付き微調整により特別なトラジェクトリ合成器を訓練する。
GEM-32BはBFCL V3 Multi-turnベンチマークで16.5%改善した。
論文 参考訳(メタデータ) (2026-01-15T12:58:46Z) - ToolForge: A Data Synthesis Pipeline for Multi-Hop Search without Real-World APIs [40.70833390513187]
本稿では,強力な実世界のツールコール性能を実現する自動合成フレームワークであるToolForgeを紹介する。
ToolForgeは、マルチホップ検索シナリオ用に設計された大規模ツール学習データを合成する。
実験結果から,合成データを用いてトレーニングした場合,8Bパラメータのみのモデルが複数のベンチマークでGPT-4oを上回っていることがわかった。
論文 参考訳(メタデータ) (2025-12-18T04:06:26Z) - Rethinking Stateful Tool Use in Multi-Turn Dialogues: Benchmarks and Challenges [30.68589269821412]
既存のベンチマークでは、言語モデル(LM)を言語エージェント(LA)としてツールとして評価しており、主にシングルターンインタラクションに重点を置いている。
ツール使用のライフサイクル全体を考慮した,ステートフルなツールインタラクションを備えたマルチターン対話データセットである textttDialogTool を提案する。
論文 参考訳(メタデータ) (2025-05-19T16:36:13Z) - ToolFlow: Boosting LLM Tool-Calling Through Natural and Coherent Dialogue Synthesis [80.34000499166648]
より関連性の高いツールの組み合わせをサンプリングするためのグラフベースのサンプリング戦略と、コヒーレントな対話の合成を導く計画を作成するための計画生成戦略を提案する。
ツールフローで生成した8000の合成対話を用いてLLaMA-3.1-8BにSFTを適用した。
その結果,GPT-4に匹敵するツールコール性能が得られた。
論文 参考訳(メタデータ) (2024-10-24T05:45:04Z) - Towards Completeness-Oriented Tool Retrieval for Large Language Models [60.733557487886635]
現実世界のシステムは多種多様なツールを組み込んでおり、全てのツールを大規模言語モデルに入力することは不可能である。
既存のツール検索手法は主にユーザクエリとツール記述間のセマンティックマッチングに焦点を当てている。
我々は,ユーザクエリとツール記述のセマンティックな類似性だけでなく,ツールの協調的情報も考慮した,新しいモデル診断型協調学習型ツール検索手法であるCOLTを提案する。
論文 参考訳(メタデータ) (2024-05-25T06:41:23Z) - ControlLLM: Augment Language Models with Tools by Searching on Graphs [97.62758830255002]
我々は,大規模言語モデル(LLM)が実世界のタスクを解くためのマルチモーダルツールを利用できる新しいフレームワークであるControlLLMを提案する。
フレームワークは,(1)複雑なタスクを明確なサブタスクに分割し,入力と出力を適切に定義したサブタスクに分解するtextittask Decomposer,(2)構築済みのツールグラフ上で最適なソリューションパスを探索する textitThoughts-on-Graph(ToG)パラダイム,(3)ソリューションパスを解釈して実行するリッチなツールボックスを備えた textitexecution Engine,の3つの主要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-10-26T21:57:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。