Fugu-MT 論文翻訳(概要): See Further for Parameter Efficient Fine-tuning by Standing on the Shoulders of Decomposition

論文の概要: See Further for Parameter Efficient Fine-tuning by Standing on the Shoulders of Decomposition

arxiv url: http://arxiv.org/abs/2407.05417v1
Date: Sun, 7 Jul 2024 15:44:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-09 19:47:49.295653
Title: See Further for Parameter Efficient Fine-tuning by Standing on the Shoulders of Decomposition
Title（参考訳）: 分解の肩に立たせられたパラメータ効率の良い微調整について
Authors: Chongjie Si, Xiaokang Yang, Wei Shen,
Abstract要約: パラメータ効率の細かいチューニング(PEFT)は、パラメータの選択したサブセットを最適化し、残りを固定し、計算とストレージのオーバーヘッドを大幅に削減することに焦点を当てている。分解の観点からそれらを分離することで、すべてのアプローチを統一する第一歩を踏み出します。本稿では,PEFT技術の性能向上を目的とした,単純かつ効果的なフレームワークとともに,新しい2つのPEFT手法を提案する。
参考スコア（独自算出の注目度）: 56.87609859444084
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The rapid expansion of large foundation models within the pre-training and fine-tuning framework has underscored that larger models often yield better results. However, the scaling up of large foundation models has led to soaring costs in fine-tuning and parameter storage, rendering extensive adaptations impractical. This challenge has sparked the development of parameter-efficient fine-tuning (PEFT), which focuses on optimizing a select subset of parameters while keeping the rest fixed, significantly lowering computational and storage overheads. While recent years have witnessed a significant success in PEFT, a deep understanding of the fundamental principles behind these methods remains unexplored. To this end, here we take the first step to unify all approaches by dissecting them from a decomposition perspective. We initiate a comprehensive mathematical analysis of these methods, allowing us to delve deeply into their underlying mechanisms, and we explore the reasons behind the variations in performance among different techniques. Furthermore, inspired by our theoretical analysis, we introduce two novel PEFT methods alongside a simple yet effective framework designed to enhance the performance of PEFT techniques across various applications. Our empirical validations, conducted across multiple datasets, demonstrate the efficacy of these methods, showcasing both theoretical validity and practical performance improvements under the guidance of our analytical findings. We believe our work will deepen researchers' understanding of PEFT and other techniques, prompting further contemplation and advancing the research across the whole community.
Abstract（参考訳）: 事前訓練および微調整フレームワークにおける大規模な基礎モデルの急速な拡張は、より大きなモデルがより良い結果をもたらすことがしばしばあることを暗示している。しかし、大規模な基礎モデルのスケールアップにより、微調整とパラメータ記憶のコストが上昇し、広範囲な適応が不可能になった。この課題はパラメータ効率の微調整(PEFT)の発展に拍車をかけたもので、パラメータの選択サブセットを最適化し、残りを固定し、計算やストレージのオーバーヘッドを大幅に削減することに焦点を当てている。近年、PEFTで大きな成功を収めているのを目撃しているが、これらの手法の背後にある基本原理の深い理解はいまだに未解明のままである。この目的のために、ここでは、分解の観点からそれらを分離することで、すべてのアプローチを統一する第一歩を踏み出します。我々はこれらの手法の総合的な数学的解析を開始し、基礎となるメカニズムを深く掘り下げることができ、異なる手法間の性能の違いの背景にある理由を探る。さらに,本理論から着想を得たPEFT手法を,PEFT技術の性能向上を目的とした簡易かつ効果的なフレームワークとともに導入した。複数のデータセットにまたがって実施した実証実験により,これらの手法の有効性が実証され,解析的知見の指導の下で理論的妥当性と実用的性能の改善が示された。我々の研究は、PEFTや他の技術に対する研究者の理解を深め、コミュニティ全体でのさらなる検討と研究の推進につながると信じています。

関連論文リスト

Symmetric Pruning of Large Language Models [61.309982086292756]
Wanda や RIA のような訓練後プルニングの手法は、シンプルだが効果的な設計で知られている。本稿では, プルーニングの標準最小化目標を再定義する新たな理論的知見を紹介する。本稿では,入力アクティベーションと重みの両面を考慮した補完戦略を提案する。
論文参考訳（メタデータ） (2025-01-31T09:23:06Z)
A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文参考訳（メタデータ） (2024-12-18T14:11:15Z)
Revisiting Prefix-tuning: Statistical Benefits of Reparameterization among Prompts [36.88984387787463]
本研究では,大規模事前学習モデルの微調整のためのプロンプトベース手法の理論的基礎について検討する。再パラメータ化は単なる工学的トリックではなく、深い理論的基礎に根ざしていることを示す。本研究は,プロンプトベース手法の理解を深める上で,理論的および経験的貢献を提供するものである。
論文参考訳（メタデータ） (2024-10-03T04:30:24Z)
HiDe-PET: Continual Learning via Hierarchical Decomposition of Parameter-Efficient Tuning [55.88910947643436]
予備学習モデル(PTM)とパラメータ効率チューニング(PET)を組み合わせた連続学習(CL)統合フレームワークを提案する。タスク固有知識とタスク共有知識を取り入れることで目的を明示的に最適化する革新的な手法である階層分解PET(HiDe-PET)を提案する。提案手法は,近年の強いベースラインの幅広いスペクトルに対して,極めて優れた性能を示す。
論文参考訳（メタデータ） (2024-07-07T01:50:25Z)
Parameter Efficient Fine Tuning: A Comprehensive Analysis Across Applications [0.7421845364041001]
ディープラーニングの台頭は、コンピュータビジョン、自然言語処理、医療画像などの分野で大きな進歩を遂げている。すべてのパラメータの調整を含む従来の微調整手法は、高い計算量とメモリ要求のために課題に直面している。本稿では,計算効率と性能のバランスをとるためにパラメータを選択的に更新するPEFT(Efficient Fine-Tuning)手法について検討する。
論文参考訳（メタデータ） (2024-04-21T02:26:15Z)
FeTrIL++: Feature Translation for Exemplar-Free Class-Incremental Learning with Hill-Climbing [3.533544633664583]
EFCIL(Exemplar-free class-incremental Learning)は、主に破滅的な忘れが原因で大きな課題を提起する。従来のEFCILのアプローチは、連続した微調整や安定性を通じて、プラスチックのモデルに傾くのが一般的である。本稿では,様々なオーバーサンプリング手法と動的最適化手法の有効性を検討するための基礎的なFeTrILフレームワークを構築した。
論文参考訳（メタデータ） (2024-03-12T08:34:05Z)
Empirical Analysis of the Strengths and Weaknesses of PEFT Techniques for LLMs [1.867982979635437]
各種PEFT手法のベンチマークを行い、異なるデータスケールでモデル性能を評価する。一般的な信念とは対照的に、PEFT手法は低データシナリオにおいて完全なチューニングよりも遅く収束することを実証的に証明する。さらに,モデルのどの部分を訓練するかを選択的に選択することで,これらのPEFT手法をさらに最適化する。
論文参考訳（メタデータ） (2023-04-28T17:39:49Z)
Scaling Down to Scale Up: A Guide to Parameter-Efficient Fine-Tuning [10.51168925267033]
本稿は,2019年前半から2024年半ばにかけて発行された50以上の論文を対象とした,パラメータ効率の高い微調整手法の体系的概要について述べる。幅広い手法を網羅し,詳細な方法比較を行う分類法を提案する。また,15種類のPEFT法を用いて,最大11Bパラメータのモデル上での性能と効率を評価する実験を行った。
論文参考訳（メタデータ） (2023-03-28T00:06:38Z)
Hierarchical Optimization-Derived Learning [58.69200830655009]
我々は,最適化モデル構築の本質的な動作とそれに対応する学習過程を同時に研究するために,階層型ODL(Hyerarchical ODL)という新しいフレームワークを構築した。これは、最適化と学習という2つの結合されたODLコンポーネントに対する最初の理論的保証である。
論文参考訳（メタデータ） (2023-02-11T03:35:13Z)
Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文参考訳（メタデータ） (2022-12-17T00:26:31Z)
Design Amortization for Bayesian Optimal Experimental Design [70.13948372218849]
予測情報ゲイン(EIG)のバウンダリに関してパラメータ化された変分モデルを最適化する。実験者が1つの変分モデルを最適化し、潜在的に無限に多くの設計に対してEIGを推定できる新しいニューラルアーキテクチャを提案する。
論文参考訳（メタデータ） (2022-10-07T02:12:34Z)
Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models [90.24999406296867]
標準の微調整とは対照的に、デルタチューニングはモデルパラメータのごく一部を微調整するだけであり、残りは触れないままである。近年の研究では、パラメータ選択の異なる一連のデルタチューニング手法が、フルパラメータの微調整と同等の性能を達成できることが示されている。
論文参考訳（メタデータ） (2022-03-14T07:56:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。