論文の概要: Continual Fine-Tuning of Large Language Models via Program Memory
- arxiv url: http://arxiv.org/abs/2605.13162v1
- Date: Wed, 13 May 2026 08:26:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.910939
- Title: Continual Fine-Tuning of Large Language Models via Program Memory
- Title(参考訳): プログラム記憶による大規模言語モデルの連続微調整
- Authors: Hung Le, Svetha Venkatesh,
- Abstract要約: Low-Rank Adaptation (LoRA) は、Large Language Models (LLM) を限定計算で適用するための標準アプローチとなっている。
神経科学におけるtextbfComplementary textbfLearning Systems にインスパイアされた textbfProgram メモリを用いた連続的な LoRA フレームワークを提案する。
- 参考スコア(独自算出の注目度): 31.698386161730486
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Parameter-Efficient Fine-Tuning (PEFT), particularly Low-Rank Adaptation (LoRA), has become a standard approach for adapting Large Language Models (LLMs) under limited compute. However, in continual settings where models are updated sequentially with small datasets, conventional LoRA updates struggle to balance rapid adaptation and knowledge retention. Existing methods typically treat the low-rank space as a homogeneous update region, lacking mechanisms to regulate how short-term updates are consolidated over time. We propose a continual LoRA framework with \textbf{Pro}gram memory, inspired by \textbf{C}omplementary \textbf{L}earning Systems in neuroscience. Our approach, dubbed \textbf{ProCL}, organizes LoRA adapters into structured program memory slots that are dynamically retrieved through input-conditioned attention. This enables rapid and localized adaptation, encouraging similar inputs to reuse shared adapter regions while reserving unused capacity for future data. The slots are then combined with the underlying adapter, which maintains a distributed representation that gradually accumulates knowledge across tasks to balance plasticity and stability. Our method operates entirely within the LoRA parameterization and incurs no additional inference cost. Experiments on diverse benchmarks demonstrate improved retention and reduced catastrophic forgetting over other continual LoRA strategies.
- Abstract(参考訳): パラメータ効率のよいファインチューニング(PEFT)、特にローランク適応(LoRA)は、計算量に制限のある大規模言語モデル(LLM)を適応するための標準アプローチとなっている。
しかしながら、モデルを小さなデータセットで逐次更新する連続的な設定では、従来のLoRA更新は、迅速な適応と知識保持のバランスをとるのに苦労する。
既存の方法は、通常、低ランク空間を均質な更新領域として扱い、短期的な更新が時間とともにどのように統合されるかを制御するメカニズムを欠いている。
本稿では,神経科学における「textbf{C}omplementary \textbf{L}earning Systems」にインスパイアされた,「textbf{Pro}gram」メモリを用いた連続LoRAフレームワークを提案する。
提案手法は,LoRAアダプタを構造化したプログラムメモリスロットに整理し,入力条件下で動的に検索する。
これにより、高速でローカライズされた適応が可能になり、同様の入力を奨励し、将来のデータのために未使用のキャパシティを保持しながら共有アダプタリージョンを再利用する。
スロットは基盤となるアダプタと結合され、可塑性と安定性のバランスをとるために、タスク間で徐々に知識を蓄積する分散表現を保持する。
我々の手法はLoRAパラメータ化内で完全に動作し、追加の推論コストは発生しない。
様々なベンチマークの実験では、継続性の向上と、他の連続的なLoRA戦略に対する破滅的な忘れ込みの低減が示されている。
関連論文リスト
- JumpLoRA: Sparse Adapters for Continual Learning in Large Language Models [78.56572636138429]
JumpLoRAは,JumpReLUゲーティングを用いてローランド適応(LoRA)ブロックの間隔を適応的に誘導する新しいフレームワークである。
特に,IncLoRAの性能を著しく向上させ,最先端のCLであるELLAよりも優れることを示す。
論文 参考訳(メタデータ) (2026-04-17T15:38:37Z) - Beyond SGD, Without SVD: Proximal Subspace Iteration LoRA with Diagonal Fractional K-FAC [50.36542772932594]
Low-Rank Adaptation (LoRA) は、凍結重量の上の低ランク更新を学習することで、大きなモデルを微調整する。
本研究では,ローランクプロジェクション(SVDLoRA)とローラファインチューニング(LoRAファインタニング)のフルステップでのトレーニングのギャップに対処する。
勾配降下のギャップを埋めるメモリ効率の良いサブルーチンであるLoRSumを提案する。
論文 参考訳(メタデータ) (2026-02-18T13:41:41Z) - Decomposing and Composing: Towards Efficient Vision-Language Continual Learning via Rank-1 Expert Pool in a Single LoRA [50.97792275353563]
単一低ランク適応 (LoRA) モジュールを分解可能な Rank-1 エキスパートプールとして再構成する,新しいフレームワークを提案する。
本手法では,このエキスパートプールから[Guided]トークンのセマンティクスに導かれて,疎結合でタスク固有の更新を動的に作成することを学ぶ。
論文 参考訳(メタデータ) (2026-01-30T10:54:51Z) - ChunkWise LoRA: Adaptive Sequence Partitioning for Memory-Efficient Low-Rank Adaptation and Accelerated LLM Inference [0.21064685964744576]
ChunkWise LoRAはトークンの複雑さに基づいてシーケンスを可変長のチャンクに分割し、各チャンクに調整されたローランク構成を割り当てる。
Wikitext-103やSQuADのようなベンチマークデータセットの実験では、ChunkWise LoRAは最大で34%のレイテンシと38%のメモリ削減を実現している。
論文 参考訳(メタデータ) (2026-01-28T22:58:28Z) - Faster Than SVD, Smarter Than SGD: The OPLoRA Alternating Update [50.36542772932594]
Low-Rank Adaptation (LoRA) は、凍結重量の上の低ランク更新を学習することで、大きなモデルを微調整する。
ローランクプロジェクションによる完全なトレーニング(SVDLoRA)とLoRAファインチューニングの間にはまだギャップがあり、LoRAのステップをさらに改善できることを示している。
論文 参考訳(メタデータ) (2025-09-24T10:32:50Z) - Adaptive Rank, Reduced Forgetting: Knowledge Retention in Continual Learning Vision-Language Models with Dynamic Rank-Selective LoRA [26.079123341965687]
低ランク学習を研究し,LoRAのランクや配置が学習や忘れにどのように影響するかを分析した。
上位のLoRAはタスク学習(塑性)を改善するが、下位のLoRAは安定性を高めるが適応を制限する。
そこで我々は,適応的に最適化されたLoRAアダプタを用いてPTMを継続的に更新する連続動的ランク選択LoRA(CoDyRA)を提案する。
論文 参考訳(メタデータ) (2024-12-01T23:41:42Z) - LoRA-FAIR: Federated LoRA Fine-Tuning with Aggregation and Initialization Refinement [12.733972494875713]
ファンデーションモデル(FM)は、タスク固有の微調整によって、多様なタスクにまたがる強力なパフォーマンスを実現する。
低ランク適応 (LoRA) のようなローランク適応 (LoRA) 手法は、少ないパラメータをチューニングするための低ランク行列を導入することで、このコストを削減する。
LoRA-FAIRは計算と通信の効率を維持し、最先端の手法よりも優れた性能が得られる。
論文 参考訳(メタデータ) (2024-11-22T14:19:01Z) - Flat-LoRA: Low-Rank Adaptation over a Flat Loss Landscape [52.98187034726091]
フルパラメータ空間の平坦領域に位置する低ランク適応を同定することを目的としたFlat-LoRAを提案する。
また、Flat-LoRAはドメイン内とドメイン外の両方の一般化を改善していることを示す。
論文 参考訳(メタデータ) (2024-09-22T11:24:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。