論文の概要: GenesisFunc: Multi-Agent Data Generation for Accurate and Generalizable Function-Calling
- arxiv url: http://arxiv.org/abs/2605.28835v1
- Date: Fri, 10 Apr 2026 14:02:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.550218
- Title: GenesisFunc: Multi-Agent Data Generation for Accurate and Generalizable Function-Calling
- Title(参考訳): GenesisFunc: 正確で一般化可能な関数計算のためのマルチエージェントデータ生成
- Authors: Hao-Xiang Xu, Chong Deng, Jiaqing Liu, Wen Wang, Qian Chen, Lujia Bao, Xiangang Li, Zhen-Hua Ling,
- Abstract要約: 関数呼び出しデータを生成する自動パイプラインであるGenesisFuncを提案する。
提案手法は,下流のツールにまたがって効果的にスケールできる可能性を示し,実世界の応用性を裏付けるものである。
- 参考スコア(独自算出の注目度): 48.71974949983576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) extend their capabilities through function-calling (FC), which relies on training data with high quality, diversity, and broad coverage of scenario. However, obtaining and annotating real function-calling data is challenging, while synthetic data from existing pipelines often suffers from unreliable APIs, limited tool scalability, insufficient diversity, and weak quality control. To address these, we present GenesisFunc, an automated pipeline for generating FC training data. Starting from reliable tools in widely used public benchmarks, our GenesisFunc employs a multi-agent framework to support a dialogue generation system that produces conversations spanning diverse scenarios, while maintaining both diversity and quality throughout the process. The accuracy of the data is further reinforced through a multi-stage evaluation system. We fine-tune an 8B LLM on the synthetic dataset and show through extensive experiments that it outperforms similarly sized open-source models in in-domain FC performance and out-of-domain generalization, while reaching FC capabilities comparable to some of the latest API-based models. In addition, our method demonstrates strong potential to scale effectively across downstream tools, underscoring its real-world applicability.
- Abstract(参考訳): 大規模言語モデル(LLM)は、高い品質、多様性、幅広いシナリオのカバレッジを持つトレーニングデータに依存する関数呼び出し(FC)を通じて、その能力を拡張します。
しかし、実際の関数呼び出しデータの取得と注釈付けは難しい。一方、既存のパイプラインからの合成データは、信頼性の低いAPI、ツールのスケーラビリティの制限、多様性の欠如、品質管理の弱さに悩まされることが多い。
これらの問題に対処するため、FCトレーニングデータを生成するための自動パイプラインであるGenesisFuncを提案する。
私たちのGenesisFuncは、広く使われている公開ベンチマークの信頼性の高いツールから始まり、多エージェントフレームワークを使用して、さまざまなシナリオにまたがる会話を生成する対話生成システムをサポートします。
多段階評価システムによりデータの精度をさらに高める。
合成データセット上で8B LLMを微調整し、最新のAPIベースモデルに匹敵するFC能力を維持しながら、ドメイン内FC性能とドメイン外一般化において、同様の規模のオープンソースモデルを上回る性能を示す広範な実験を行った。
さらに,本手法は,下流のツールにまたがって効果的にスケールできる可能性を示し,実世界の応用性を裏付けるものである。
関連論文リスト
- AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis [30.512393568258105]
大規模言語モデルエージェントは、ツールを介して現実世界の問題を解決する可能性を実証するが、汎用的な知性は、質の低い長期データによってボトルネックとなる。
本稿では,現実的なセマンティックなドメイン間でのマルチターンインタラクションデータを合成する,完全に自動化されたフレームワークであるAgentSkillerを提案する。
論文 参考訳(メタデータ) (2026-02-10T03:21:42Z) - Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models [83.65386456026441]
Data-Juicer 2.0は、テキスト、画像、ビデオ、オーディオのモダリティにまたがる100以上のデータ処理オペレータがバックアップするデータ処理システムである。
データ分析、合成、アノテーション、基礎モデルのポストトレーニングなど、より重要なタスクをサポートする。
このシステムは公開されており、さまざまな研究分野やAlibaba Cloud PAIのような現実世界の製品で広く採用されている。
論文 参考訳(メタデータ) (2024-12-23T08:29:57Z) - What are the Essential Factors in Crafting Effective Long Context Multi-Hop Instruction Datasets? Insights and Best Practices [91.71951459594074]
拡張コンテキストウィンドウを持つLong Language Model (LLM) は、情報抽出、質問応答、複雑な計画シナリオなどのタスクを大幅に改善した。
既存のメソッドは通常、Self-Instructフレームワークを使用して、長いコンテキスト能力を改善するために命令チューニングデータを生成する。
本稿では,品質検証エージェント,シングルホップ質問生成エージェント,複数質問サンプリング戦略,マルチホップ質問マーガーエージェントを組み込んだマルチエージェント対話型マルチホップ生成フレームワークを提案する。
以上の結果から,我々の合成高品位長文指導データにより,多量の人体で訓練したモデルよりも,モデル性能が著しく向上することが示唆された。
論文 参考訳(メタデータ) (2024-09-03T13:30:00Z) - ToolACE: Winning the Points of LLM Function Calling [139.07157814653638]
ToolACEは、正確で複雑で多様なツール学習データを生成するように設計された自動エージェントパイプラインである。
我々は、合成データに基づいてトレーニングされたモデルが、8Bパラメータだけで、バークレー・ファンクション・カリング・リーダーボード上で最先端のパフォーマンスを達成することを実証した。
論文 参考訳(メタデータ) (2024-09-02T03:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。