Fugu-MT 論文翻訳(概要): Magnet: Multi-turn Tool-use Data Synthesis and Distillation via Graph Translation

論文の概要: Magnet: Multi-turn Tool-use Data Synthesis and Distillation via Graph Translation

arxiv url: http://arxiv.org/abs/2503.07826v1
Date: Mon, 10 Mar 2025 20:13:07 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-12 22:35:51.436864
Title: Magnet: Multi-turn Tool-use Data Synthesis and Distillation via Graph Translation
Title（参考訳）: マグネット:多目的ツールデータ合成とグラフ変換による蒸留
Authors: Fan Yin, Zifeng Wang, I-Hung Hsu, Jun Yan, Ke Jiang, Yanfei Chen, Jindong Gu, Long T. Le, Kai-Wei Chang, Chen-Yu Lee, Hamid Palangi, Tomas Pfister,
Abstract要約: 本稿では,大規模言語モデルエージェントのための高品質なトレーニングトラジェクトリを合成するための原則的フレームワークを提案する。このフレームワークは、関数シグネチャパスからクエリのシーケンスと実行可能な関数呼び出しへの自動的で反復的な変換に基づいている。実験の結果,14BモデルであるMagnetic-14B-mDPOでは,BFCL-v3では68.01,ToolQueryでは73.30が得られた。
参考スコア（独自算出の注目度）: 85.68881632498909
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large language models (LLMs) have exhibited the ability to effectively utilize external tools to address user queries. However, their performance may be limited in complex, multi-turn interactions involving users and multiple tools. To address this, we propose Magnet, a principled framework for synthesizing high-quality training trajectories to enhance the function calling capability of large language model agents in multi-turn conversations with humans. The framework is based on automatic and iterative translations from a function signature path to a sequence of queries and executable function calls. We model the complicated function interactions in multi-turn cases with graph and design novel node operations to build reliable signature paths. Motivated by context distillation, when guiding the generation of positive and negative trajectories using a teacher model, we provide reference function call sequences as positive hints in context and contrastive, incorrect function calls as negative hints. Experiments show that training with the positive trajectories with supervised fine-tuning and preference optimization against negative trajectories, our 14B model, Magnet-14B-mDPO, obtains 68.01 on BFCL-v3 and 73.30 on ToolQuery, surpassing the performance of the teacher model Gemini-1.5-pro-002 by a large margin in function calling.
Abstract（参考訳）: 大規模言語モデル(LLM)は、ユーザクエリに対処するための外部ツールを効果的に活用する能力を示した。しかしながら、それらのパフォーマンスは、ユーザと複数のツールを含む複雑なマルチターンインタラクションに制限される可能性がある。そこで我々は,人間とのマルチターン会話において,大規模言語モデルエージェントの関数呼び出し能力を高めるために,高品質な学習軌道を合成するための基本フレームワークであるマグネットを提案する。このフレームワークは、関数シグネチャパスからクエリのシーケンスと実行可能な関数呼び出しへの自動的で反復的な変換に基づいている。グラフを用いたマルチターンケースにおける複雑な関数相互作用をモデル化し、信頼性の高いシグネチャパスを構築するための新しいノード操作を設計する。文脈蒸留により動機づけられた教師モデルを用いて正および負の軌跡の生成を導く際には、文脈における正のヒントとして参照関数呼び出しシーケンスを提供し、負のヒントとして逆の関数呼び出しを提供する。実験により, 教師モデルであるGemini-1.5-pro-002よりも高い関数呼び出し率で, 教師モデルであるGemini-1.5-pro-002を上回り, 14BモデルであるMagne-14B-mDPOが68.01, ToolQueryでは73.30を得ることができた。

関連論文リスト

Bayesian Optimization for Enhanced Language Models: Optimizing Acquisition Functions [0.6554326244334868]
大規模な言語モデルの微調整を改善するために,バイレベルBO戦略と組み合わせたモデル融合アプローチであるBilevel - BO - SWAを導入する。内ループはトレーニング損失の最小化を行い,外ループはw.r.t.valメトリックを最適化する。 RoBERTA-baseを用いたGLUEタスクの実験では、EIとUCBを使用すると、一般化が向上し、チューニングが最大2.7%改善できることが示されている。
論文参考訳（メタデータ） (2025-05-22T10:16:56Z)
Small Models, Big Tasks: An Exploratory Empirical Study on Small Language Models for Function Calling [6.102559098873098]
関数呼び出しは、情報検索、ソフトウェア工学、自動化といった分野に広く応用される複雑なタスクである。 LLM(Large Language Models)はこのプロセスを自動化できるが、計算コストが高く、リソース制約のある環境では実用的ではない。小型言語モデル(SLM)は効率よく動作し、応答時間を短縮し、計算要求を低減できる。
論文参考訳（メタデータ） (2025-04-27T15:26:51Z)
Reasoning with Reinforced Functional Token Tuning [70.96651128307985]
本稿では,大規模言語モデル(LLM)に自己学習能力を持たせるためにRFTT(Reinforced Functional Token Tuning)を提案する。 RFTTは、学習可能な関数トークンの豊富なセットをモデル語彙に直接埋め込んで、多様な人間のような推論行動によるチェーン・オブ・思想の構築を可能にする。
論文参考訳（メタデータ） (2025-02-19T02:59:42Z)
HammerBench: Fine-Grained Function-Calling Evaluation in Real Mobile Device Scenarios [31.43638572775755]
HammerBenchは、実世界のマルチターン対話におけるモバイルアシスタント機能呼び出し機能を評価するための新しいフレームワークである。実験の結果、異なるタイプのパラメータ名エラーが、異なる相互作用シナリオにおける重大な障害の原因であることを明らかにした。
論文参考訳（メタデータ） (2024-12-21T07:33:55Z)
Building Math Agents with Multi-Turn Iterative Preference Learning [56.71330214021884]
本稿では,モデル性能をさらに向上させるために,補完的な直接選好学習手法について検討する。既存の直接選好学習アルゴリズムは、もともとシングルターンチャットタスク用に設計されている。この文脈に合わせたマルチターン直接選好学習フレームワークを提案する。
論文参考訳（メタデータ） (2024-09-04T02:41:04Z)
ToolACE: Winning the Points of LLM Function Calling [139.07157814653638]
ToolACEは、正確で複雑で多様なツール学習データを生成するように設計された自動エージェントパイプラインである。我々は、合成データに基づいてトレーニングされたモデルが、8Bパラメータだけで、バークレー・ファンクション・カリング・リーダーボード上で最先端のパフォーマンスを達成することを実証した。
論文参考訳（メタデータ） (2024-09-02T03:19:56Z)
Granite-Function Calling Model: Introducing Function Calling Abilities via Multi-task Learning of Granular Tasks [35.97890508648945]
我々はApache 2.0ライセンスの下で-20B-FUNCTIONCALLINGモデルを紹介します。モデルは7つの基本的なタスクに対してマルチタスクトレーニングアプローチを使用してトレーニングされる。 20B-FUNCTIONCALLINGは、7つの異なる評価データセットにおいて、複数のタスクに対してより一般化可能であることを示す。
論文参考訳（メタデータ） (2024-06-27T17:47:26Z)
Aligning Language Models with Demonstrated Feedback [58.834937450242975]
Demonstration ITerated Task Optimization (DITTO)は、言語モデルの出力とユーザの実証された振る舞いを直接調整する。我々は,DITTOがニュース記事やメール,ブログ記事などのドメイン間できめ細かいスタイルやタスクアライメントを学習する能力を評価する。
論文参考訳（メタデータ） (2024-06-02T23:13:56Z)
Mixture of Latent Experts Using Tensor Products [44.816454454687]
マルチタスク学習では、従来の手法では複数のタスクでモデルを同時にトレーニングする。モジュール型言語モデルが肯定的伝達と体系的一般化を促進できるかどうかを検討する。具体的には、パラメータ効率とニュアンス付きルーティング手法のバランスをとる新しいモジュラー言語モデル(textttTensorPoly)を提案する。
論文参考訳（メタデータ） (2024-05-26T19:25:08Z)
Learning From Failure: Integrating Negative Examples when Fine-tuning Large Language Models as Agents [41.14201835950814]
大規模言語モデル(LLM)は、検索エンジンなどのツールを介して環境と対話するエージェントとして機能することに成功した。これまでの研究は、LLMと環境の間の相互作用軌跡を初めて収集し、小さなモデルを微調整するためにタスクを完了した軌道のみを用いていた。これらの軌道からLLMは適切な品質制御と微調整戦略によって学習することができると我々は主張する。
論文参考訳（メタデータ） (2024-02-18T17:10:07Z)
Task-Feature Collaborative Learning with Application to Personalized Attribute Prediction [166.87111665908333]
本稿では,TFCL(Task-Feature Collaborative Learning)と呼ばれる新しいマルチタスク学習手法を提案する。具体的には、まず、特徴とタスクの協調的なグループ化を活用するために、不均一なブロック対角構造正規化器を用いたベースモデルを提案する。実際の拡張として,重なり合う機能と難易度を区別することで,基本モデルを拡張します。
論文参考訳（メタデータ） (2020-04-29T02:32:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。