Fugu-MT 論文翻訳(概要): Private Fine-tuning of Large Language Models with Zeroth-order Optimization

論文の概要: Private Fine-tuning of Large Language Models with Zeroth-order Optimization

arxiv url: http://arxiv.org/abs/2401.04343v1
Date: Tue, 9 Jan 2024 03:53:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-10 17:03:34.085019
Title: Private Fine-tuning of Large Language Models with Zeroth-order Optimization
Title（参考訳）: ゼロ次最適化による大規模言語モデルのプライベート微調整
Authors: Xinyu Tang, Ashwinee Panda, Milad Nasr, Saeed Mahloujifar, Prateek Mittal
Abstract要約: DP-ZO(DP-ZO)は、ゼロオーダー最適化を民営化し、トレーニングデータのプライバシを保存する、大規模言語モデルを微調整する新しい手法である。 DP-ZOは、SQuADから1000のトレーニングサンプルにOPT-66Bを微調整すると、プライバシが1,10-5)$-DPになるため、わずか1.86%のパフォーマンス低下を示す。
参考スコア（独自算出の注目度）: 54.24600476755372
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Fine-tuning large pretrained models on private datasets may run the risk of violating privacy. Differential privacy is a framework for mitigating privacy risks by enforcing algorithmic stability. DP-SGD enables training models with private data in a privacy-preserving manner, but raises new obstacles in the form of performance loss and significant engineering challenges. We introduce DP-ZO, a new method for fine-tuning large language models that preserves the privacy of training data by privatizing zeroth-order optimization. A key insight into the design of our method is that the direction of the gradient in SPSA, the zeroth-order algorithm we use, is always random and the only information that depends on private data is the step size, i.e., a scalar. Therefore, we only need to privatize the scalar step size, which is memory-efficient. DP-ZO, which can be instantiated with either Laplace or Gaussian noise, provides a strong privacy-utility trade-off across different tasks, and model sizes, under conservative privacy budgets. One noteworthy result is that DP-ZO exhibits just $1.86\%$ performance degradation due to privacy at $(1,10^{-5})$-DP when fine-tuning OPT-66B on 1000 training samples from SQuAD.
Abstract（参考訳）: プライベートデータセット上の微調整された大規模な事前トレーニングモデルは、プライバシーを侵害するリスクを負う可能性がある。差分プライバシーは、アルゴリズムの安定性を強制することによってプライバシーリスクを軽減するためのフレームワークである。 DP-SGDは、プライバシ保存方式でプライベートデータを使用したトレーニングモデルを可能にするが、パフォーマンス損失と重要なエンジニアリング上の課題という形で、新たな障害を生じさせる。 DP-ZO(DP-ZO)は,ゼロオーダー最適化を民営化し,学習データのプライバシーを保護した大規模言語モデルを微調整する手法である。この手法の設計に関する重要な洞察は、我々が使っているゼロ次アルゴリズムであるspsaの勾配の方向は常にランダムであり、プライベートデータに依存する唯一の情報はステップサイズ、すなわちスカラーである。したがって、メモリ効率のよいスカラーステップサイズを民営化するだけでよいのです。 DP-ZOはLaplaceかGaussianノイズでインスタンス化できるが、保守的なプライバシー予算の下で、さまざまなタスクやモデルサイズにわたる強力なプライバシー利用トレードオフを提供する。 1つの注目すべき結果として、DP-ZOは、SQuADから1000のトレーニングサンプルに対してOPT-66Bを微調整すると、プライバシーのためにわずか1,10^{-5})$-DPで1.86\%のパフォーマンス劣化を示す。

関連論文リスト

DiSK: Differentially Private Optimizer with Simplified Kalman Filter for Noise Reduction [57.83978915843095]
本稿では,微分プライベート勾配の性能を著しく向上する新しいフレームワークであるDiSKを紹介する。大規模トレーニングの実用性を確保するため,Kalmanフィルタプロセスを簡素化し,メモリと計算要求を最小化する。
論文参考訳（メタデータ） (2024-10-04T19:30:39Z)
LMO-DP: Optimizing the Randomization Mechanism for Differentially Private Fine-Tuning (Large) Language Models [31.718398512438238]
本稿では,LMO-DP(Language Model-based Optimal Differential Privacy)機構を提案する。これは、最適化された言語モデルの厳密な構成を、サブ最適DPメカニズムで実現するための第一歩である。 LMO-DPはまた、強力な差分プライバシー保証を持つLlama-2を正確に微調整する最初のソリューションでもある。
論文参考訳（メタデータ） (2024-05-29T05:32:50Z)
Pre-training Differentially Private Models with Limited Public Data [54.943023722114134]
ディファレンシャルプライバシ(DP)は、モデルに提供されるセキュリティの度合いを測定するための重要な手法である。 DPはまだ、最初の事前訓練段階で使用されるデータのかなりの部分を保護することができない。公共データの10%しか利用しない新しいDP継続事前学習戦略を開発した。 ImageNet-21kのDP精度は41.5%、非DP精度は55.7%、下流タスクのPlaces365とiNaturalist-2021では60.0%である。
論文参考訳（メタデータ） (2024-02-28T23:26:27Z)
Differentially Private Zeroth-Order Methods for Scalable Large Language Model Finetuning [0.0]
プリトレーニング済みLLMのDP微調整は、タスク固有のデータセットのプライバシ保護に広く用いられている。 DP-SGDのスケーラビリティを限界まで押し上げたにもかかわらず、DP-SGDベースの微調整法は残念ながらSGD固有の非効率性によって制限されている。
論文参考訳（メタデータ） (2024-02-12T17:24:15Z)
Sparsity-Preserving Differentially Private Training of Large Embedding Models [67.29926605156788]
DP-SGDは、差分プライバシーと勾配降下を組み合わせたトレーニングアルゴリズムである。 DP-SGDをネーティブに埋め込みモデルに適用すると、勾配の間隔が破壊され、トレーニング効率が低下する。我々は,大規模埋め込みモデルのプライベートトレーニングにおいて,勾配間隔を保ったDP-FESTとDP-AdaFESTの2つの新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-11-14T17:59:51Z)
Pre-trained Perceptual Features Improve Differentially Private Image Generation [8.659595986100738]
差分降下勾配(DP-SGD)を用いた中等度生成モデルの訓練も困難である。私たちは、情報のある公開データセット上に適切な、関連する表現を構築し、その表現でプライベートデータをモデル化することを学びます。私たちの研究は、プライベートと非プライベートの深層生成モデルの間のギャップを減らすための、シンプルで強力な基盤を導入しています。
論文参考訳（メタデータ） (2022-05-25T16:46:01Z)
Large Scale Transfer Learning for Differentially Private Image Classification [51.10365553035979]
Differential Privacy(DP)は、個別のサンプルレベルのプライバシで機械学習モデルをトレーニングするための正式なフレームワークを提供する。 DP-SGDを用いたプライベートトレーニングは、個々のサンプル勾配にノイズを注入することで漏れを防ぐ。この結果は非常に魅力的であるが,DP-SGDを用いた大規模モデルのトレーニングの計算コストは,非プライベートトレーニングよりもかなり高い。
論文参考訳（メタデータ） (2022-05-06T01:22:20Z)
Large Language Models Can Be Strong Differentially Private Learners [70.0317718115406]
Differentially Private(DP)学習は、テキストの大規模なディープラーニングモデルを構築する上で、限られた成功を収めている。この性能低下は,大規模な事前学習モデルを用いることで緩和可能であることを示す。本稿では,DP-SGDにおけるクリッピングを,サンプルごとの勾配をインスタンス化せずに実行可能にするメモリ節約手法を提案する。
論文参考訳（メタデータ） (2021-10-12T01:45:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。