Fugu-MT 論文翻訳(概要): Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

論文の概要: Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

arxiv url: http://arxiv.org/abs/2603.09527v1
Date: Tue, 10 Mar 2026 11:35:58 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-11 15:25:24.253125
Title: Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation
Title（参考訳）: パラメータおよびデータ効率適応によるドラフトモデルの効率的な調整
Authors: Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong Ji,
Abstract要約: 投機的復号化は、特定のドメインに対してターゲットモデルを微調整する場合、性能劣化に悩まされる。単純な解決策は、コストがかかり非効率な、すべてのターゲットモデルのドラフトモデルをトレーニングすることです。 EDA(Efficient Draft Adaptation)と呼ばれるパラメータとデータ効率のフレームワークを導入する。
参考スコア（独自算出の注目度）: 82.04574413609187
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Speculative decoding accelerates LLM inference but suffers from performance degradation when target models are fine-tuned for specific domains. A naive solution is to retrain draft models for every target model, which is costly and inefficient. To address this, we introduce a parameter- and data-efficient framework named Efficient Draft Adaptation, abbreviated as EDA, for efficiently adapting draft models. EDA introduces three innovations: (1) a decoupled architecture that utilizes shared and private components to model the shared and target-specific output distributions separately, enabling parameter-efficient adaptation by updating only the lightweight private component;(2) a data regeneration strategy that utilizes the fine-tuned target model to regenerate training data, thereby improving the alignment between training and speculative decoding, leading to higher average acceptance length;(3) a sample selection mechanism that prioritizes high-value data for efficient adaptation. Our experiments show that EDA effectively restores speculative performance on fine-tuned models, achieving superior average acceptance lengths with significantly reduced training costs compared to full retraining. Code is available at https://github.com/Lyn-Lucy/Efficient-Draft-Adaptation.
Abstract（参考訳）: 投機的復号化はLLM推論を加速させるが、特定のドメインに対してターゲットモデルを微調整すると性能劣化に悩まされる。単純な解決策は、コストがかかり非効率な、すべてのターゲットモデルのドラフトモデルをトレーニングすることです。これを解決するために,EDA(Efficient Draft Adaptation)というパラメータとデータ効率のフレームワークを導入する。 EDAは,(1)共有コンポーネントとプライベートコンポーネントを別々にモデル化し,軽量なプライベートコンポーネントのみを更新することでパラメータ効率の高い適応を可能にする疎結合アーキテクチャ,(2)微調整されたターゲットモデルを用いてトレーニングデータを再生するデータ再生戦略を導入し,トレーニングと投機的復号の整合性を向上し,平均受入期間を長くするサンプル選択機構を導入する。実験の結果,EDAは微調整モデル上での投機的性能を効果的に回復し,完全再訓練に比べてトレーニングコストが大幅に低減された平均受入長を達成できることがわかった。コードはhttps://github.com/Lyn-Lucy/Efficient-Draft-Adaptationで入手できる。

論文の概要: Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

関連論文リスト