論文の概要: Gradient Transformer: Learning to Generate Updates for LLMs
- arxiv url: http://arxiv.org/abs/2605.27591v1
- Date: Tue, 26 May 2026 19:05:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-29 01:06:09.726942
- Title: Gradient Transformer: Learning to Generate Updates for LLMs
- Title(参考訳): Gradient Transformer: LLMの更新生成を学ぶ
- Authors: Binh-Nguyen Nguyen, Khang Tran, NhatHai Phan, Issa Khalil,
- Abstract要約: 本稿では,TinyLMをベースとした更新ベクトルを生成するデータフリーな知識蒸留フレームワークを提案する。
我々のフレームワークのキーとなるアイデアは、TinyLMの更新ベクトルをLLMの更新ベクトルに変換する、新しいGradient Transformerである。
Grad-Transformerは、厳格な差分プライバシー保護の下でさえ、最先端の知識蒸留のベースラインを著しく上回ります。
- 参考スコア(独自算出の注目度): 6.715862410529471
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many organizations lack computational resources to fine-tune large language models (LLMs) on private (unshareable) data for better utility, while fine-tuning tiny language models (TinyLMs) alone performs poorly. To address this bottleneck, we propose a data-free knowledge distillation framework that generates LLM update vectors based on TinyLMs fine-tuned on private data. An update vector is a vector of parameter changes from an initial model to its fine-tuned version on a dataset, capturing the effect of cumulative gradient steps during fine-tuning. The key idea of our framework is a novel Gradient Transformer that transforms TinyLM's update vectors into LLM's update vectors. As derived from shadow datasets, Grad-Transformer captures the correlation between TinyLM and LLM update vectors, enabling third-party providers to generate LLM update vectors given the organization's TinyLM update vectors without accessing the organization's private data. The framework supports multi-organization collaboration to jointly update LLMs, improving performance and cost-efficiency. Extensive experiments across language modeling and reasoning tasks show that Grad-Transformer remarkably outperforms state-of-the-art knowledge distillation baselines, even under strict differential privacy protection.
- Abstract(参考訳): 多くの組織は、プライベートな(共有不可能な)データに基づいて細調整可能な大規模言語モデル(LLM)をより良いユーティリティのために使用するための計算資源を欠いているが、細調整された小さな言語モデル(TinyLMs)だけではパフォーマンスが良くない。
このボトルネックに対処するため,私的データに基づいて微調整されたTinyLMに基づいてLLM更新ベクトルを生成する,データフリーな知識蒸留フレームワークを提案する。
更新ベクトルは、初期モデルからデータセット上の微調整バージョンへのパラメータ変更のベクトルであり、微調整中の累積勾配ステップの効果をキャプチャする。
我々のフレームワークのキーとなるアイデアは、TinyLMの更新ベクトルをLLMの更新ベクトルに変換する、新しいGradient Transformerである。
シャドーデータセットから派生したGrad-Transformerは、TinyLMとLM更新ベクタの相関をキャプチャし、組織のTinyLM更新ベクタにアクセスせずに、サードパーティプロバイダがLLM更新ベクタを生成することができる。
このフレームワークは、LLMを共同で更新するマルチ組織コラボレーションをサポートし、パフォーマンスとコスト効率を改善している。
言語モデリングと推論タスクの広範な実験により、Grad-Transformerは厳格な差分プライバシー保護の下でさえ、最先端の知識蒸留のベースラインを著しく上回っていることが示された。
関連論文リスト
- Multi-Objective Large Language Model Unlearning [3.372396620898397]
グラディエント・アセント(GA)は、対象データ上のモデルの予測確率を減少させるプロアクティブな方法である。
本稿では,多目的大規模言語モデル学習(MOLLM)アルゴリズムを提案する。
実験の結果,MLLM が SOTA GA をベースとした LLM アンラーニング法よりも非ラーニング効果とモデルユーティリティ保存の点で優れていたことが確認された。
論文 参考訳(メタデータ) (2024-12-29T09:35:56Z) - Improving the Ability of Pre-trained Language Model by Imparting Large Language Model's Experience [4.814313782484443]
大規模言語モデル (LLM) と事前訓練型言語モデル (LM) は多くのソフトウェア工学のタスクにおいて驚くべき成功を収めた。
我々は、LLMを用いてドメイン固有のデータを生成し、目標タスクにおける事前学習されたLMの性能を向上させる。
論文 参考訳(メタデータ) (2024-08-16T06:37:59Z) - CodecLM: Aligning Language Models with Tailored Synthetic Data [51.59223474427153]
命令追従能力のための高品質な合成データを適応的に生成するフレームワークであるCodecLMを紹介する。
まず、ターゲットの指示分布をキャプチャするために、オンザフライで生成された簡潔なキーワードであるメタデータにシード命令をエンコードする。
また、デコード中に自己論理とコントラストフィルタを導入し、データ効率の良いサンプルを調整する。
論文 参考訳(メタデータ) (2024-04-08T21:15:36Z) - MLLM-DataEngine: An Iterative Refinement Approach for MLLM [62.30753425449056]
本稿では,データ生成,モデルトレーニング,評価を橋渡しする新しいクローズドループシステムを提案する。
各ループ内で、MLLM-DataEngineはまず評価結果に基づいてモデルの弱点を分析する。
ターゲットとして,異なる種類のデータの比率を調整する適応型バッドケースサンプリングモジュールを提案する。
品質については、GPT-4を用いて、各データタイプで高品質なデータを生成する。
論文 参考訳(メタデータ) (2023-08-25T01:41:04Z) - LLM-Pruner: On the Structural Pruning of Large Language Models [65.02607075556742]
大規模言語モデル(LLM)は、言語理解と生成において顕著な能力を示している。
タスク非依存であり、元のトレーニングデータセットへの依存を最小限に抑えるという2つの制約の範囲内でLLMの圧縮に取り組む。
LLM-Prunerという名前のこの手法は、非臨界結合構造を選択的に除去する構造プルーニングを採用する。
論文 参考訳(メタデータ) (2023-05-19T12:10:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。