Fugu-MT 論文翻訳(概要): All-in-One Tuning and Structural Pruning for Domain-Specific LLMs

論文の概要: All-in-One Tuning and Structural Pruning for Domain-Specific LLMs

arxiv url: http://arxiv.org/abs/2412.14426v2
Date: Fri, 20 Dec 2024 15:57:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-23 18:46:08.606081
Title: All-in-One Tuning and Structural Pruning for Domain-Specific LLMs
Title（参考訳）: ドメイン特化LDMのオールインワンチューニングと構造解析
Authors: Lei Lu, Zhepeng Wang, Runxue Bao, Mengbing Wang, Fangyi Li, Yawen Wu, Weiwen Jiang, Jie Xu, Yanzhi Wang, Shangqian Gao,
Abstract要約: ATP-オールインワンチューニングと構造プランニングを統一した1段階構造プランニングと微細チューニングのアプローチとして提案する。 ATPは、法律および医療分野におけるタスクにおいて、最先端の2段階のプルーニング手法より優れている。
参考スコア（独自算出の注目度）: 46.673873831225656
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Existing pruning techniques for large language models (LLMs) targeting domain-specific applications typically follow a two-stage process: pruning the pretrained general-purpose LLMs and then fine-tuning the pruned LLMs on specific domains. However, the pruning decisions, derived from the pretrained weights, remain unchanged during fine-tuning, even if the weights have been updated. Therefore, such a combination of the pruning decisions and the finetuned weights may be suboptimal, leading to non-negligible performance degradation. To address these limitations, we propose ATP: All-in-One Tuning and Structural Pruning, a unified one-stage structural pruning and fine-tuning approach that dynamically identifies the current optimal substructure throughout the fine-tuning phase via a trainable pruning decision generator. Moreover, given the limited available data for domain-specific applications, Low-Rank Adaptation (LoRA) becomes a common technique to fine-tune the LLMs. In ATP, we introduce LoRA-aware forward and sparsity regularization to ensure that the substructures corresponding to the learned pruning decisions can be directly removed after the ATP process. ATP outperforms the state-of-the-art two-stage pruning methods on tasks in the legal and healthcare domains. More specifically, ATP recovers up to 88% and 91% performance of the dense model when pruning 40% parameters of LLaMA2-7B and LLaMA3-8B models, respectively.
Abstract（参考訳）: ドメイン固有のアプリケーションをターゲットにした、既存の大規模言語モデル(LLM)のプルーニング技術は、2段階のプロセスに従うのが一般的である。しかし、事前訓練された重量から導かれたプルーニングの決定は、たとえ重量が更新されたとしても、微調整中に変化しない。したがって、プルーニング決定と微調整された重みの組み合わせは最適以下であり、非無視的な性能劣化をもたらす可能性がある。これらの制限に対処するため,我々はATPを提案する: All-in-One Tuning and Structure Pruning, an unified one-stage structure pruning and fine-tuning approach, which is dynamic identified the current optimal substructure across the fine-tuning phase through a trainable pruning decision generator。さらに、ドメイン固有のアプリケーションで利用可能な限られたデータを考えると、Low-Rank Adaptation (LoRA) はLLMを微調整する一般的な手法となっている。 ATP では,学習されたプルーニング決定に対応する部分構造が ATP プロセス後に直接取り除けることを保証するために,LoRA 対応のフォワードとスパーシリティ正則化を導入する。 ATPは、法律および医療分野におけるタスクにおいて、最先端の2段階のプルーニング手法より優れている。具体的には、LLaMA2-7BモデルとLLaMA3-8Bモデルの40%のパラメータを刈り取ると、ATPは高密度モデルの最大88%と91%のパフォーマンスを回復する。

関連論文リスト

SkipGPT: Dynamic Layer Pruning Reinvented with Token Awareness and Module Decoupling [16.742839354514512]
我々は,大規模言語モデルを最適化する動的層プルーニングフレームワークであるSkipGPTを紹介する。また,SkipGPTはモデルパラメータの40%以上を削減できることを示す。
論文参考訳（メタデータ） (2025-06-04T17:26:31Z)
Pangu Light: Weight Re-Initialization for Pruning and Accelerating LLMs [79.7618807098457]
大きな言語モデル(LLM)は多くのタスクにまたがって最先端の機能を提供しますが、その巨大なサイズと推論コストは、実用的なデプロイメントに重大な計算上の課題をもたらします。本稿は,このような積極的関節切断を実現させる上で重要な,しばしば見落とされがちな側面として,残った重量の戦略的再初期化と調整があげられることを論じる。構造化プルーニングを中心としたLCM加速のためのフレームワークであるPangu Lightと、新しい重量再初期化技術を紹介する。
論文参考訳（メタデータ） (2025-05-26T15:57:08Z)
Two-Stage Regularization-Based Structured Pruning for LLMs [32.65416603453818]
TRSP: 大規模言語モデルのための2段階規則化に基づく構造化プルーニング。 TRSPは, 再学習を必要とせず, 強い階層構造を有するプルーニング法よりも優れた性能を示すことを示す。層ワイドプルーニング法として、注目すべきエンドツーエンドアクセラレーションを提供する。
論文参考訳（メタデータ） (2025-05-23T12:40:59Z)
Unlocking Tuning-Free Few-Shot Adaptability in Visual Foundation Models by Recycling Pre-Tuned LoRAs [76.40876036912537]
大規模言語モデル(LLM)は、微調整を必要とせず、強力な少数ショット適応性を示す。現在のVisual Foundation Models (VFM) は十分なチューニングデータを持つ明示的な微調整を必要とする。そこで我々は, メタ学習目的の多様なLoRAからメタLoRAを蒸留するフレームワークであるLoRA Recycleを提案する。
論文参考訳（メタデータ） (2024-12-03T07:25:30Z)
Bypass Back-propagation: Optimization-based Structural Pruning for Large Language Models via Policy Gradient [57.9629676017527]
大規模言語モデルを用いた最適化に基づく構造解析手法を提案する。我々は,プルーニングモデルの損失を最適化することにより,確率空間におけるプルーニングマスクを直接学習する。 A100 GPUで13Bモデルに対して約35GBのメモリで2.7時間動作させる。
論文参考訳（メタデータ） (2024-06-15T09:31:03Z)
Comparative Analysis of Different Efficient Fine Tuning Methods of Large Language Models (LLMs) in Low-Resource Setting [0.0]
我々は、大規模言語モデル(LLM)の様々な微調整戦略の理解を深めようとしている。我々は,2つのデータセット(COLAとMNLI)で事前学習したモデルに対して,バニラファインチューニングやPBFT(Pattern-Based Fine-Tuning)のような最先端の手法を比較した。以上の結果から,バニラFTやPBFTに匹敵する領域外一般化が期待できる可能性が示唆された。
論文参考訳（メタデータ） (2024-05-21T20:08:52Z)
Model Extrapolation Expedites Alignment [135.12769233630362]
本研究では,人選好によるアライメントトレーニングを迅速化するExPOという手法を提案する。我々は、ExPOがトレーニングされたDPOモデルを20%のステップで強化し、完全に訓練されたモデルを上回ることを実証した。 ExPO は AlpacaEval 2.0 と MT-Bench ベンチマークにおいて,既存のオープンソース LLM を特に改善している。
論文参考訳（メタデータ） (2024-04-25T17:39:50Z)
PRILoRA: Pruned and Rank-Increasing Low-Rank Adaptation [65.268245109828]
我々はPRILoRAを導入し、各層ごとに異なるランクを線形に割り当て、トレーニングプロセスを通してプルーニングを行う。 8つのGLUEベンチマークで広範な実験を行い,PRILoRAの有効性を検証する。
論文参考訳（メタデータ） (2024-01-20T20:25:17Z)
Tuning Language Models by Proxy [110.49482736590907]
直接チューニングと同じ目的を達成するために,ブラックボックスLM上で動作する軽量復号時間アルゴリズムであるプロキシチューニングを導入する。提案手法は, 小型のLMをチューニングし, 小型のLMと未チューニングのLMの予測の差を適用して, より大型の未チューニングモデルの本来の予測をチューニング方向にシフトさせる。
論文参考訳（メタデータ） (2024-01-16T18:49:55Z)
Fluctuation-based Adaptive Structured Pruning for Large Language Models [44.217363567065]
FLAP(FLuctuation-based Adaptive Structured Pruning)は、大規模言語モデルのためのトレーニング不要な構造化プルーニングフレームワークである。ストレージを効果的に削減し、推論速度を向上することで、ハードウェアに優しい。
論文参考訳（メタデータ） (2023-12-19T09:23:48Z)
Hyperparameter Optimization for Large Language Model Instruction-Tuning [6.743825167463901]
トレーニング済みLLMをブラックボックスとして微調整と検証を行うパイプライン全体について検討する。本研究では,提案アルゴリズムを用いて高次パラメータの空間を効率的に探索し,チューニングモデルの性能向上と人為的アライメントを実現する。
論文参考訳（メタデータ） (2023-12-01T22:03:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。