論文の概要: FinToolSyn: A forward synthesis Framework for Financial Tool-Use Dialogue Data with Dynamic Tool Retrieval
- arxiv url: http://arxiv.org/abs/2603.24051v1
- Date: Wed, 25 Mar 2026 08:00:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.198993
- Title: FinToolSyn: A forward synthesis Framework for Financial Tool-Use Dialogue Data with Dynamic Tool Retrieval
- Title(参考訳): FinToolSyn:動的ツール検索による金融ツール利用対話データのための前方合成フレームワーク
- Authors: Caishuang Huang, Yang Qiao, Rongyu Zhang, Junjie Ye, Pu Lu, Wenxi Wu, Meng Zhou, Xiku Du, Tao Gui, Qi Zhang, Xuanjing Huang,
- Abstract要約: FinToolSynは、高品質な財務対話を生成するために設計された前方合成フレームワークである。
パイプラインは43,066のツールのリポジトリを構築し、148万以上の対話インスタンスを合成する。
大規模な実験により、FinToolSynでトレーニングされたモデルは21.06%改善された。
- 参考スコア(独自算出の注目度): 59.67674731525128
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tool-use capabilities are vital for Large Language Models (LLMs) in finance, a domain characterized by massive investment targets and data-intensive inquiries. However, existing data synthesis methods typically rely on a reverse synthesis paradigm, generating user queries from pre-sampled tools. This approach inevitably introduces artificial explicitness, yielding queries that fail to capture the implicit, event-driven nature of real-world needs. Moreover, its reliance on static tool sets overlooks the dynamic retrieval process required to navigate massive tool spaces. To address these challenges, we introduce \textit{FinToolSyn}, a forward synthesis framework designed to generate high-quality financial dialogues. Progressing from persona instruction and atomic tool synthesis to dynamic retrieval dialogue generation, our pipeline constructs a repository of 43,066 tools and synthesizes over 148k dialogue instances, incorporating dynamic retrieval to emulate the noisy candidate sets typical of massive tool spaces. We also establish a dedicated benchmark to evaluate tool-calling capabilities in realistic financial scenarios. Extensive experiments demonstrate that models trained on FinToolSyn achieve a 21.06\% improvement, providing a robust foundation for tool learning in financial scenarios.
- Abstract(参考訳): ツール・ユース機能は、巨額の投資目標とデータ集約的な問い合わせによって特徴づけられる領域である金融における大規模言語モデル(LLM)にとって不可欠である。
しかし、既存のデータ合成手法は典型的には逆合成パラダイムに依存しており、事前サンプリングされたツールからユーザクエリを生成する。
このアプローチは必然的に人工的な明示性を導入し、実際のニーズの暗黙的でイベント駆動的な性質を捉えないクエリを生成する。
さらに、静的ツールセットへの依存は、巨大なツール空間をナビゲートするために必要な動的検索プロセスを見落としている。
これらの課題に対処するために,高品質な財務対話を生成するために設計された前方合成フレームワークである \textit{FinToolSyn} を紹介する。
ペルソナ命令とアトミックツール合成から動的検索対話生成へと進化し,43,066個のツールのリポジトリを構築し,148k以上の対話インスタンスを合成する。
また、現実的な金融シナリオにおいて、ツールコール機能を評価するための専用のベンチマークを構築します。
大規模な実験では、FinToolSynでトレーニングされたモデルは21.06パーセントの改善を実現し、金融シナリオにおけるツール学習の堅牢な基盤を提供する。
関連論文リスト
- Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text [48.25052564552558]
本稿では,テキストコーパスから多ターンツール利用トラジェクトリの生成と抽出を可能にするデータ合成パイプラインであるGEMを紹介する。
計算コストを削減するため,教師付き微調整により特別なトラジェクトリ合成器を訓練する。
GEM-32BはBFCL V3 Multi-turnベンチマークで16.5%改善した。
論文 参考訳(メタデータ) (2026-01-15T12:58:46Z) - Simulating Complex Multi-Turn Tool Calling Interactions in Stateless Execution Environments [14.539418822648658]
DiGiT-TCは、ステートフルな環境で検索によって生成された会話の特徴を持つ会話を呼び出すツールを作成するように設計されている。
標準ツール呼び出しベンチマークに対する我々のアプローチを検証するとともに、ステートフルな問題設定においても、我々のアプローチはパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2026-01-06T20:04:30Z) - SynthTools: A Framework for Scaling Synthetic Tools for Agent Development [5.411691071249542]
合成ツールエコシステムを生成するためのフレキシブルでスケーラブルなフレームワークであるSynthToolsを紹介します。
私たちのフレームワークは3つのコアコンポーネントで構成されています。多種多様なツールの自動作成のためのツール生成、現実的なツールの振る舞いをエミュレートするツールシミュレーション、ツールシミュレーションの正確性と一貫性を保証するツール監査です。
スケーラブルで多様性があり、信頼性の高いツールエコシステムを実現することで、SynthToolsは大規模なトレーニングへの実践的なパスと、ツール使用エージェントの安定した評価を提供する。
論文 参考訳(メタデータ) (2025-11-11T19:26:40Z) - FinSight: Towards Real-World Financial Deep Research [68.31086471310773]
FinSightは、高品質でマルチモーダルな財務報告を作成するための新しいフレームワークである。
プロフェッショナルグレードの可視化を確保するため,反復視覚強調機構を提案する。
2段階のBinging Frameworkは、簡潔な分析セグメントをコヒーレント、引用認識、マルチモーダルレポートに拡張する。
論文 参考訳(メタデータ) (2025-10-19T14:05:35Z) - ToolFlow: Boosting LLM Tool-Calling Through Natural and Coherent Dialogue Synthesis [80.34000499166648]
より関連性の高いツールの組み合わせをサンプリングするためのグラフベースのサンプリング戦略と、コヒーレントな対話の合成を導く計画を作成するための計画生成戦略を提案する。
ツールフローで生成した8000の合成対話を用いてLLaMA-3.1-8BにSFTを適用した。
その結果,GPT-4に匹敵するツールコール性能が得られた。
論文 参考訳(メタデータ) (2024-10-24T05:45:04Z) - Towards Completeness-Oriented Tool Retrieval for Large Language Models [60.733557487886635]
現実世界のシステムは多種多様なツールを組み込んでおり、全てのツールを大規模言語モデルに入力することは不可能である。
既存のツール検索手法は主にユーザクエリとツール記述間のセマンティックマッチングに焦点を当てている。
我々は,ユーザクエリとツール記述のセマンティックな類似性だけでなく,ツールの協調的情報も考慮した,新しいモデル診断型協調学習型ツール検索手法であるCOLTを提案する。
論文 参考訳(メタデータ) (2024-05-25T06:41:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。