Fugu-MT 論文翻訳(概要): ReLoRA: Knowledge-Reusing Adaptation for Fast Rollout of Evolving LLM Services

論文の概要: ReLoRA: Knowledge-Reusing Adaptation for Fast Rollout of Evolving LLM Services

arxiv url: http://arxiv.org/abs/2606.02606v1
Date: Sat, 23 May 2026 15:56:16 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-07 20:42:22.586128
Title: ReLoRA: Knowledge-Reusing Adaptation for Fast Rollout of Evolving LLM Services
Title（参考訳）: ReLoRA: LLMサービスの高速ロールアウトのための知識再利用適応
Authors: Yang Xu, Zihuai Xu, Hongli Xu, Yunming Liao, Zhiwei Yao, Xitong Fu,
Abstract要約: 大規模言語モデル(LLM)は、継続的に進化するサービスとして、ますます多くデプロイされている。頻繁なベースモデル更新は、以前デプロイされたタスク固有のローランド適応(LoRA)アダプタを無効にする可能性がある。本稿では,LLM サービスの進化のために,サービス対応の LoRA アダプタを効率的に復元する知識再利用型再適応フレームワーク ReLoRA を提案する。
参考スコア（独自算出の注目度）: 17.956439583365544
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) are increasingly deployed as continuously evolving services, where frequent base-model updates may invalidate previously deployed task-specific Low-Rank Adaptation (LoRA) adapters. For service providers managing numerous downstream model services, retraining each LoRA adapter from scratch for every updated base model is computationally prohibitive and delays service rollout. Meanwhile, the simpler alternative, i.e., naively applying the original LoRA adapter to the updated base model, often leads to degraded service quality due to adapter-backbone incompatibility. To address this problem, we propose ReLoRA, a knowledge-reusing re-adaptation framework that efficiently restores service-ready LoRA adapters for evolving LLM services while preserving or improving task performance. Specifically, ReLoRA comprises two key optimization steps: 1) Adaptive LoRA initialization leverages Bayesian optimization to construct a compatibility-aware starting point by fusing information from both the previously deployed task adapter and the base model's evolution; 2) Fine-tuning with scheduled regularization first rapidly steers the adapter to a high-quality region via strong regularization, followed by relaxed regularization for task-specific refinement. This design enables rapid service-quality recovery with reduced re-adaptation overhead. Extensive experiments demonstrate that ReLoRA reduces time-to-readiness by up to 8.9$\times$ and improves accuracy by up to 4.6\% compared to baselines.
Abstract（参考訳）: 大きな言語モデル(LLM)は、継続的に進化するサービスとしてますますデプロイされ、ベースモデルの頻繁な更新は、以前デプロイされたタスク固有のローランド適応(LoRA)アダプタを無効にする可能性がある。多くのダウンストリームモデルサービスを管理するサービスプロバイダにとって、更新されたベースモデル毎に各LoRAアダプタをスクラッチからトレーニングすることは、計算的に禁止され、サービスのロールアウトが遅れる。一方、より単純な代替案、すなわちオリジナルのLoRAアダプタを更新ベースモデルに適用することで、しばしばアダプタバックボーンの不互換性によるサービス品質が低下する。この問題を解決するために,LLM サービスの進化のためのサービス対応 LoRA アダプタを効率よく復元し,タスク性能を維持・改善する知識再利用型再適応フレームワーク ReLoRA を提案する。具体的には、ReLoRAには2つの重要な最適化ステップがある。 1) 適応LoRA初期化はベイズ最適化を利用して,以前にデプロイされたタスクアダプタからの情報とベースモデルの進化を融合させて,互換性を考慮した出発点を構築する。 2) スケジュール正則化によるファインチューニングは, 高い正則化を経た後に, タスク固有の精細化のための緩和された正則化を行う。この設計は、再適応オーバーヘッドを減らし、迅速なサービス品質回復を可能にする。大規模な実験では、ReLoRAは最大8.9$\times$を削減し、ベースラインに比べて4.6\%の精度を向上している。

論文の概要: ReLoRA: Knowledge-Reusing Adaptation for Fast Rollout of Evolving LLM Services

関連論文リスト