論文の概要: PCEvolve: Private Contrastive Evolution for Synthetic Dataset Generation via Few-Shot Private Data and Generative APIs
- arxiv url: http://arxiv.org/abs/2506.05407v1
- Date: Wed, 04 Jun 2025 13:33:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.132799
- Title: PCEvolve: Private Contrastive Evolution for Synthetic Dataset Generation via Few-Shot Private Data and Generative APIs
- Title(参考訳): PCEvolve: Few-Shot Private DataとGenerative APIによる合成データセット生成のためのプライベートコントラスト進化
- Authors: Jianqing Zhang, Yang Liu, Jie Fu, Yang Hua, Tianyuan Zou, Jian Cao, Qiang Yang,
- Abstract要約: プライベート進化(PE)アルゴリズムは拡散モデルAPIを用いて差分プライバシー(DP)合成画像を生成する。
実際には、医療や業界といった専門分野では、ごくわずかのプライベートデータの問題が特に多い。
提案手法は,複数ショットのプライベートデータにおいて,クラス間のコントラスト関係を反復的にマイニングする,新しいAPI支援アルゴリズムであるPrivate Contrastive Evolution (PCEvolve)を提案する。
- 参考スコア(独自算出の注目度): 39.108700932535754
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The rise of generative APIs has fueled interest in privacy-preserving synthetic data generation. While the Private Evolution (PE) algorithm generates Differential Privacy (DP) synthetic images using diffusion model APIs, it struggles with few-shot private data due to the limitations of its DP-protected similarity voting approach. In practice, the few-shot private data challenge is particularly prevalent in specialized domains like healthcare and industry. To address this challenge, we propose a novel API-assisted algorithm, Private Contrastive Evolution (PCEvolve), which iteratively mines inherent inter-class contrastive relationships in few-shot private data beyond individual data points and seamlessly integrates them into an adapted Exponential Mechanism (EM) to optimize DP's utility in an evolution loop. We conduct extensive experiments on four specialized datasets, demonstrating that PCEvolve outperforms PE and other API-assisted baselines. These results highlight the potential of leveraging API access with private data for quality evaluation, enabling the generation of high-quality DP synthetic images and paving the way for more accessible and effective privacy-preserving generative API applications. Our code is available at https://github.com/TsingZ0/PCEvolve.
- Abstract(参考訳): 生成APIの台頭は、プライバシ保護のための合成データ生成への関心を喚起している。
Private Evolution(PE)アルゴリズムは拡散モデルAPIを用いて差分プライバシー(DP)合成画像を生成するが、DPが保護する類似性投票アプローチの制限のため、少数のプライベートデータと競合する。
実際には、医療や業界といった専門分野では、ごくわずかのプライベートデータの問題が特に多い。
この課題に対処するために、我々は、個々のデータポイントを超えた数ショットのプライベートデータにおいて、固有のクラス間コントラスト関係を反復的にマイニングし、それらを適応された指数メカニズム(EM)にシームレスに統合し、進化ループにおけるDPの有用性を最適化する、新しいAPI支援アルゴリズム、PCEvolveを提案する。
4つの特別なデータセットに対して広範な実験を行い、PCEvolveがPEやその他のAPI支援ベースラインより優れていることを示した。
これらの結果は、プライベートデータによるAPIアクセスを品質評価に活用し、高品質なDP合成画像の生成を可能にし、よりアクセス性が高く効果的なプライバシ保護生成APIアプリケーションを実現する可能性を強調している。
私たちのコードはhttps://github.com/TsingZ0/PCEvolve.comで利用可能です。
関連論文リスト
- Differentially Private Synthetic Data via APIs 3: Using Simulators Instead of Foundation Model [17.92638160807867]
差分プライベート(DP)合成データは、プライバシーを損なうことなく、プライベートデータの価値を解放するための重要なツールとなっている。
プライベート・エボリューション(PE)はDP合成データを生成するための有望な方法として登場した。
PEフレームワークは基盤モデルを超えたAPIを可能にするのに十分な一般性を持っていることを示す。
論文 参考訳(メタデータ) (2025-02-08T09:50:30Z) - Differentially Private Fine-Tuning of Diffusion Models [22.454127503937883]
微分プライバシーと拡散モデル(DM)の統合は、有望だが挑戦的なフロンティアを示している。
この分野での最近の進歩は、公開データによる事前学習によって高品質な合成データを生成する可能性を強調している。
本稿では,プライバシとユーティリティのトレードオフを高めるために,トレーニング可能なパラメータの数を最小限に抑える,プライベート拡散モデルに最適化された戦略を提案する。
論文 参考訳(メタデータ) (2024-06-03T14:18:04Z) - Differentially Private Synthetic Data via Foundation Model APIs 2: Text [56.13240830670327]
現実世界で生成された高品質なテキストデータはプライベートであり、プライバシー上の懸念から自由に共有したり、利用したりすることはできない。
テキストの複雑な設定に適用可能な拡張PEアルゴリズムであるAug-PEを提案する。
その結果, Aug-PE は SOTA DP の微調整ベースラインと競合する DP 合成テキストを生成することがわかった。
論文 参考訳(メタデータ) (2024-03-04T05:57:50Z) - Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。
本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。
我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文 参考訳(メタデータ) (2023-12-10T07:38:56Z) - A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。
これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。
差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文 参考訳(メタデータ) (2023-09-27T14:38:16Z) - Differentially Private Synthetic Data via Foundation Model APIs 1: Images [29.27468374365625]
この問題を解決するために,PE(Private Evolution)と呼ばれる新しいフレームワークを提案する。
PEは、モデルトレーニングなしで、最先端のSOTA(State-of-the-art)メソッドと一致させることができる。
例えば、CIFAR10では、プライバシコストのエプシロン=0.67でFID = 7.9を達成し、以前のSOTAをエプシロン=32から大幅に改善します。
論文 参考訳(メタデータ) (2023-05-24T23:47:26Z) - Don't Generate Me: Training Differentially Private Generative Models
with Sinkhorn Divergence [73.14373832423156]
そこで我々はDP-Sinkhornを提案する。DP-Sinkhornは個人データからデータ分布を差分プライバシで学習するための新しいトランスポートベース生成手法である。
差分的にプライベートな生成モデルを訓練するための既存のアプローチとは異なり、我々は敵の目的に頼らない。
論文 参考訳(メタデータ) (2021-11-01T18:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。