論文の概要: GIFT: Guided Fine-Tuning and Transfer for Enhancing Instruction-Tuned Language Models
- arxiv url: http://arxiv.org/abs/2605.01256v1
- Date: Sat, 02 May 2026 05:27:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.670854
- Title: GIFT: Guided Fine-Tuning and Transfer for Enhancing Instruction-Tuned Language Models
- Title(参考訳): GIFT:インストラクション調整型言語モデル構築のためのファインチューニングと転送のガイド
- Authors: Zhiwen Ruan, Yichao Du, Jianjie Zheng, Longyue Wang, Yun Chen, Peng Li, Jinsong Su, Yang Liu, Guanhua Chen,
- Abstract要約: GIFT(Guided Fine-Tuning and Transfer)は、命令モデルからタスク適応へのガイダンスを組み込んだフレームワークである。
G GIFTは、命令チューニングモデルから得られた信頼信号を用いて、事前訓練ベースモデルの低ランクアダプタを微調整する。
数式および知識集約型ベンチマークを用いて,複数のモデルファミリおよびスケールでGIFTを評価する。
- 参考スコア(独自算出の注目度): 47.12048554977284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A promising paradigm for adapting instruction-tuned language models is to learn task-specific updates on a pretrained base model and subsequently merge them into the instruction-tuned model. However, existing approaches typically treat the instruction-tuned model as a passive target that is only involved at the final merging stage, without guiding the training process. We propose GIFT (Guided Fine-Tuning and Transfer), a simple and efficient framework that incorporates guidance from the instruction model into task adaptation. GIFT fine-tunes a low-rank adapter on the pretrained base model using confidence signals derived from the instruction-tuned model. The learned adapter is then merged into the instruction-tuned model, yielding task-specialized models that preserve general instruction-following behavior. We evaluate GIFT on mathematical and knowledge-intensive benchmarks across multiple model families and scales. Results show that GIFT consistently outperforms direct fine-tuning and representative transfer-based baselines, while maintaining robust generalization and favorable test-time scaling behavior.
- Abstract(参考訳): 命令チューニングされた言語モデルを適用するための有望なパラダイムは、事前訓練されたベースモデル上でタスク固有の更新を学習し、その後、命令チューニングされたモデルにマージすることである。
しかし、既存のアプローチでは、トレーニングプロセスを導くことなく、命令調整されたモデルを最終統合段階でのみ関与する受動的ターゲットとして扱うのが一般的である。
GIFT(Guided Fine-Tuning and Transfer)は,命令モデルからタスク適応へのガイダンスを組み込んだ,シンプルで効率的なフレームワークである。
GIFTは、命令チューニングモデルから得られた信頼信号を用いて、事前訓練ベースモデルの低ランクアダプタを微調整する。
学習したアダプタを命令調整モデルにマージし、一般的な命令追従動作を保持するタスク特化モデルを生成する。
数式および知識集約型ベンチマークを用いて,複数のモデルファミリおよびスケールでGIFTを評価する。
結果から,GIFTは高い一般化と良好なテスト時間スケーリング動作を維持しつつ,直接微調整および代表的転送ベースラインを一貫して上回っていることがわかった。
関連論文リスト
- GRAM: A Generative Foundation Reward Model for Reward Generalization [48.63394690265176]
まず,大規模教師なし学習を用いて学習し,教師付き学習により微調整を行う生成報酬モデルを開発した。
このモデルは、応答ランキング、人間のフィードバックからの強化学習、微調整によるタスク適応など、様々なタスクをうまく一般化する。
論文 参考訳(メタデータ) (2025-06-17T04:34:27Z) - Shadow-FT: Tuning Instruct Model via Training on Paired Base Model [67.20706292627106]
大規模言語モデル(LLM)は、様々なタスクのさらなる微調整の恩恵を一貫して受けている。
本稿では,対応するベースモデルを活用してインストラクタモデルをチューニングするための新しいシャドウ-FTフレームワークを提案する。
提案するShadow-FTは,追加パラメータを導入せず,実装が容易で,性能が大幅に向上する。
論文 参考訳(メタデータ) (2025-05-19T05:16:21Z) - Bayesian Principles Improve Prompt Learning In Vision-Language Models [10.593234723172767]
本稿では,適応性と一般化性のバランスをとるためのベイズ学習原理に基づく新たな学習目標関数を提案する。
この目的は、訓練済みモデルに近いまま、微調整されたモデルが下流のタスクに適応できるようにすることでバランスを確立する。
論文 参考訳(メタデータ) (2025-04-19T00:48:09Z) - An Emulator for Fine-Tuning Large Language Models using Small Language
Models [91.02498576056057]
本研究では,異なるスケールでの事前学習と微調整の結果を近似する分布から,エミュレート・ファインチューニング(EFT)を原理的かつ実用的なサンプリング法として導入する。
EFTは、追加トレーニングを伴わずに、有益性や無害性といった競合する行動特性をテスト時間で調整できることを示す。
最後に、LMアップスケーリングと呼ばれるエミュレートされたファインチューニングの特殊な場合において、小さなファインチューニングモデルと組み合わせることで、大きな事前学習モデルのリソース集約的なファインチューニングを回避する。
論文 参考訳(メタデータ) (2023-10-19T17:57:16Z) - Becoming self-instruct: introducing early stopping criteria for minimal
instruct tuning [0.0]
Instruction following Score (IFS, Instruction following Score) は、言語モデルの指示に従う能力を検出するメトリクスである。
利用可能なベースモデルとインストラクタモデルをベンチマークし, 部分文と完全文との整形応答の比率が有効であることを示す。
IFS for Supervised Fine-Tuning (SFT) of 7B and 13B LLaMA model。
論文 参考訳(メタデータ) (2023-07-05T09:42:25Z) - Mixture-of-Experts Meets Instruction Tuning:A Winning Combination for
Large Language Models [125.91897197446379]
MoEモデルは高密度モデルよりも命令チューニングの恩恵を受ける。
我々の最も強力なモデルであるFLAN-MOE-32Bは、4つのベンチマークタスクにおけるFLAN-PALM-62Bの性能を上回る。
論文 参考訳(メタデータ) (2023-05-24T04:22:26Z) - Bridging Pre-trained Models and Downstream Tasks for Source Code
Understanding [13.65914588243695]
本稿では,事前学習されたモデルとコード関連タスクをブリッジする手法を提案する。
我々は、下流データの多様性を豊かにする意味保存変換を利用する。
本稿では,既存の事前学習モデルを微調整するために,変換されたデータを手軽に整理するためのカリキュラム学習を紹介する。
論文 参考訳(メタデータ) (2021-12-04T07:21:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。