論文の概要: DP-SelFT: Differentially Private Selective Fine-Tuning for Large Language Models
- arxiv url: http://arxiv.org/abs/2605.17432v1
- Date: Sun, 17 May 2026 12:55:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.015604
- Title: DP-SelFT: Differentially Private Selective Fine-Tuning for Large Language Models
- Title(参考訳): DP-SelFT:大規模言語モデルのための微分プライベート選択ファインチューニング
- Authors: Haichao Sha, Zihao Wang, Yuncheng Wu, Hong Chen, Wei Dong,
- Abstract要約: 大規模言語モデル(LLM)の個人選択微調整のためのフレームワークであるDP-SelFTを提案する。
DP-SelFTは、パラメータ選択におけるDP固有の3つの課題に対処している。
実験の結果、DP-SelFTはプライバシー保証の下で、既存のDPファインチューニングベースラインに対するプライバシーとユーティリティのトレードオフを一貫して改善していることがわかった。
- 参考スコア(独自算出の注目度): 28.62057098410814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) are commonly adapted to downstream tasks through fine-tuning, but fine-tuning data often contains sensitive information that may be leaked by the resulting model. Differential privacy (DP) offers formal protection against such leakage, yet DP fine-tuning of LLMs still suffers from substantial utility degradation due to gradient clipping and noise injection. Existing work improves this trade-off by combining DP with parameter-efficient fine-tuning methods such as LoRA, which constrain the form of updates. In this work, we study a complementary direction: selective fine-tuning, which constrains where updates are applied. We propose DP-SelFT, a framework for differentially private selective fine-tuning of LLMs. DP-SelFT addresses three DP-specific challenges in parameter selection: avoiding repeated privacy cost, improving stability under noisy estimates, and selecting parameters that remain useful under clipped and noisy updates. It first constructs a lightweight DP synthetic dataset and performs selection only on this synthetic data, so the selection stage incurs no additional privacy cost. It then conducts layer-level selection by temporarily training candidate layer subsets on a synthetic training split and evaluating them on a synthetic validation split. Crucially, this temporary training is performed under a perturbation regime matched to downstream DP fine-tuning, with worst-case perturbations of the same scale as DP noise. This favors layer subsets that are not only learnable but also robust to noisy private updates. Experiments on benchmark tasks show that DP-SelFT consistently improves the privacy--utility trade-off over existing DP fine-tuning baselines under the same privacy guarantees.
- Abstract(参考訳): 大規模言語モデル(LLM)は、細調整によって下流タスクに適応することが多いが、微調整データには、結果のモデルによってリークされる可能性のある機密情報が含まれていることが多い。
差分プライバシー(DP)は、そのような漏洩に対する公式な保護を提供するが、DPによるLCMの微調整は、勾配クリッピングやノイズ注入による実用性低下に悩まされている。
既存の作業は、DPとLoRAのようなパラメータ効率のよい微調整手法を組み合わせることで、このトレードオフを改善している。
本研究では,更新が適用される制約である選択的微調整について,補完的な方向について検討する。
DP-SelFTは, LLMの選択的微調整のためのフレームワークである。
DP-SelFTは、パラメータ選択におけるDP固有の3つの課題に対処している。
まず、軽量なDP合成データセットを構築し、この合成データに対してのみ選択を行うため、選択段階では追加のプライバシコストが発生しない。
次に、合成トレーニングスプリット上で候補層サブセットを一時的に訓練し、合成検証スプリット上で評価することにより、層レベルの選択を行う。
重要なことは、この一時的な訓練は、下流のDP微調整と一致する摂動体制の下で行われ、最悪ケースの摂動はDPノイズと同じ規模である。
これにより、学習可能なだけでなく、ノイズの多いプライベートアップデートにも堅牢なレイヤサブセットが好まれる。
ベンチマークタスクの実験では、DP-SelFTは同じプライバシー保証の下で、既存のDPファインチューニングベースラインに対するプライバシーとユーティリティのトレードオフを一貫して改善している。
関連論文リスト
- Improving Parameter-Efficient Federated Learning with Differentially Private Refactorization [8.171217925484921]
パラメータ効率の良い微調整によるフェデレートラーニング(FL)は、分散データ上でスケーラブルなモデルトレーニングを可能にする。
Low-Rank Adaptation (LoRA)は、グローバルアグリゲーション中にエラーを導入し、差分プライバシー(DP)の負の効果を増幅する。
サーバサイドアグリゲーションを再活性化する,差分的にプライベートなクロスサイロFLフレームワークであるFedPowerを提案する。
論文 参考訳(メタデータ) (2026-05-08T20:06:09Z) - Differentially Private Subspace Fine-Tuning for Large Language Models [23.87587995037086]
微分プライバシー(DP)は厳格なプライバシー保証を提供し、微調整で広く採用されている。
正式なDP保証を保ちながら、雑音の大きさを大幅に低減する2段階サブスペース微調整法であるDP-SFTを提案する。
複数のデータセットの実験により、DP-SFTは厳密なDP制約の下で精度と安定性を高め、収束を加速し、DP微調整ベースラインよりも大幅に向上することを示した。
論文 参考訳(メタデータ) (2026-01-16T09:15:46Z) - DiSK: Differentially Private Optimizer with Simplified Kalman Filter for Noise Reduction [57.83978915843095]
本稿では,微分プライベート勾配の性能を著しく向上する新しいフレームワークであるDiSKを紹介する。
大規模トレーニングの実用性を確保するため,Kalmanフィルタプロセスを簡素化し,メモリと計算要求を最小化する。
論文 参考訳(メタデータ) (2024-10-04T19:30:39Z) - DOPPLER: Differentially Private Optimizers with Low-pass Filter for Privacy Noise Reduction [47.65999101635902]
差分プライベート(DP)トレーニングは、トレーニングされた機械学習モデルから収集したトレーニングデータの機密情報の漏洩を防止する。
DOPPLERと呼ばれる新しいコンポーネントを開発し、この周波数領域内のDPノイズを効果的に増幅する。
実験の結果,低域通過フィルタを用いたDPは,試験精度で3%-10%向上した。
論文 参考訳(メタデータ) (2024-08-24T04:27:07Z) - Differentially Private Zeroth-Order Methods for Scalable Large Language Model Finetuning [0.0]
プリトレーニング済みLLMのDP微調整は、タスク固有のデータセットのプライバシ保護に広く用いられている。
DP-SGDのスケーラビリティを限界まで押し上げたにもかかわらず、DP-SGDベースの微調整法は残念ながらSGD固有の非効率性によって制限されている。
論文 参考訳(メタデータ) (2024-02-12T17:24:15Z) - Make Landscape Flatter in Differentially Private Federated Learning [69.78485792860333]
本稿では,DPの負の影響を軽減するために勾配摂動を利用するDP-FedSAMという新しいDPFLアルゴリズムを提案する。
具体的には、DP-FedSAMは、局所的な平坦性モデルと、より優れた安定性と重量頑健性を統合し、DPノイズに対する局所的な更新とロバスト性の小さなノルムをもたらす。
提案アルゴリズムは,DPFLの既存のSOTAベースラインと比較して,最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2023-03-20T16:27:36Z) - Smoothed Differential Privacy [55.415581832037084]
微分プライバシー(DP)は、最悪のケース分析に基づいて広く受け入れられ、広く適用されているプライバシーの概念である。
本稿では, 祝賀されたスムーズな解析の背景にある最悪の平均ケースのアイデアに倣って, DPの自然な拡張を提案する。
サンプリング手順による離散的なメカニズムはDPが予測するよりもプライベートであるのに対して,サンプリング手順による連続的なメカニズムはスムーズなDP下では依然としてプライベートではないことが証明された。
論文 参考訳(メタデータ) (2021-07-04T06:55:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。