論文の概要: PrivCode++: Latent-Conditioned Differentially Private Code Generation for Comprehensive Guarantees
- arxiv url: http://arxiv.org/abs/2606.09145v1
- Date: Mon, 08 Jun 2026 07:42:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.808499
- Title: PrivCode++: Latent-Conditioned Differentially Private Code Generation for Comprehensive Guarantees
- Title(参考訳): PrivCode++: 包括的な保証のための遅延コンディション付き差分プライベートコード生成
- Authors: Zheng Liu, Chen Gong, Terry Yue Zhuo, Zhou Yang, Kecen Li, Wenlong Meng, Xinwen Hou, Yu Liu, Xiaochen Li,
- Abstract要約: 命令-コードペアに微調整された大規模な言語モデルは、記憶し、その後、センシティブなトレーニングデータをリークする。
既存の差分プライベート(DP)コード生成メソッドは、主にコードスニペットを保護し、プロンプトが公開であると仮定する。
PrivCode-Plusはプライバシフリー遅延コンディショニングモジュールを備えた2段階のDPフレームワークを導入した。
- 参考スコア(独自算出の注目度): 27.487220334182666
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models fine-tuned on instruction-code pairs may memorize and subsequently leak sensitive training data. Existing differentially private (DP) code generation methods primarily protect code snippets while assuming prompts are public, which fails in realistic scenarios where prompts may also contain sensitive information. When prompts cannot be explicitly learned or used during generation, code synthesis suffers from severe utility degradation as well as reduced diversity and fidelity. To address these challenges, we propose PrivCode-Plus, the first work to explore DP code generation where both prompts and code snippets are considered sensitive in LLM fine-tuning. PrivCode-Plus introduces a two-stage DP framework with a Privacy-Free Latent Conditioning module, enabling effective DP fine-tuning and data synthesis without direct access to sensitive prompts or code. Extensive experiments show that PrivCode-Plus achieves substantially higher utility than baselines, remains competitive with the method with relaxing privacy assumptions, and provides stronger privacy guarantees.
- Abstract(参考訳): 命令-コードペアに微調整された大規模な言語モデルは、記憶し、その後、センシティブなトレーニングデータをリークする。
既存の差分プライベート(DP)コード生成メソッドは、主にコードスニペットを保護し、プロンプトが公開であると仮定する。
生成中にプロンプトを明示的に学習または使用できない場合、コード合成は、多様性と忠実度を低下させるとともに、深刻なユーティリティ劣化に悩まされる。
これらの課題に対処するために,PrivCode-Plusを提案する。PrivCode-PlusはDPコード生成において,プロンプトとコードスニペットの両方がLLMの微調整に敏感であると考えられる。
PrivCode-Plusは、プライバシフリー遅延コンディショニングモジュールを備えた2段階のDPフレームワークを導入し、センシティブなプロンプトやコードに直接アクセスすることなく、効果的なDP微調整とデータ合成を可能にする。
大規模な実験により、PrivCode-Plusはベースラインよりもはるかに高いユーティリティを実現し、プライバシの仮定を緩和する手法と競合し、より強力なプライバシ保証を提供することが示された。
関連論文リスト
- Towards Privacy-Preserving Code Generation: Differentially Private Code Language Models [2.4216414826638353]
本研究は,CodeLLMにおける差分プライバシー(DP)の有効性を体系的に評価する。
DPはテストされたすべてのスニペットタイプにわたるCodeLLMのメモリ化を大幅に削減する。
DPは難易度をわずかに向上させるが、CodeLLMsのコード生成機能も強化できる。
論文 参考訳(メタデータ) (2025-12-12T11:31:13Z) - PrivCode: When Code Generation Meets Differential Privacy [28.319022961888006]
異なるプライベートコード生成は、機密コードを保護する理論的保証を提供する。
PrivCodeは、コードデータセット用に特別に設計された最初のDPシンセサイザーである。
プライバシとユーティリティの両方を改善するための2段階のフレームワークが組み込まれている。
論文 参考訳(メタデータ) (2025-12-05T06:27:06Z) - Pr$εε$mpt: Sanitizing Sensitive Prompts for LLMs [49.84954577111077]
Pr$epsilonepsilon$mptは、プロンプト消毒剤を実装する新しいシステムである。
Pr$epsilonepsilon$mptは、意味のあるプライバシー保証を実現するための実用的な方法であることを示す。
論文 参考訳(メタデータ) (2025-04-07T14:52:40Z) - Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning [62.224804688233]
差分プライバシ(DP)は、モデルが特定のプライバシユニットで「ほとんど区別できない」ことを保証することで、有望なソリューションを提供する。
ユーザ間でのプライバシー保護の確保に必要なアプリケーションによって動機づけられたユーザレベルのDPについて検討する。
論文 参考訳(メタデータ) (2024-06-20T13:54:32Z) - DP-OPT: Make Large Language Model Your Privacy-Preserving Prompt Engineer [57.04801796205638]
大きな言語モデル(LLM)は、様々なタスクのための支配的なツールとして現れています。
しかし、データプライバシに関する懸念は、調整されたプロンプトが機密情報に依存しているため、障害となる。
本稿では,DP-OPT(Dis Differentially-Private Offsite Prompt Tuning)を提案する。
論文 参考訳(メタデータ) (2023-11-27T02:01:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。