論文の概要: Synthesize Privacy-Preserving High-Resolution Images via Private Textual Intermediaries
- arxiv url: http://arxiv.org/abs/2506.07555v1
- Date: Mon, 09 Jun 2025 08:48:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.873037
- Title: Synthesize Privacy-Preserving High-Resolution Images via Private Textual Intermediaries
- Title(参考訳): プライベートテキスト・インターミディエートによるプライバシー保護高解像度画像の合成
- Authors: Haoxiang Wang, Zinan Lin, Da Yu, Huishuai Zhang,
- Abstract要約: 本稿では,SPTI(Synsration via Private Textual Intermediaries)と呼ばれる新しい手法を提案する。
SPTIはまず、各プライベート画像をテキストモデルに画像を用いた簡潔なテキスト記述に要約し、その後、修正されたPrivate Evolutionアルゴリズムを適用してDPテキストを生成し、最終的に画像モデルにテキストを使用したイメージを再構成する。
プライベートデータセットが与えられた場合、SPTIは以前のDPアプローチよりもかなり高品質な合成画像を生成する。
- 参考スコア(独自算出の注目度): 20.848029366537165
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating high fidelity, differentially private (DP) synthetic images offers a promising route to share and analyze sensitive visual data without compromising individual privacy. However, existing DP image synthesis methods struggle to produce high resolution outputs that faithfully capture the structure of the original data. In this paper, we introduce a novel method, referred to as Synthesis via Private Textual Intermediaries (SPTI), that can generate high resolution DP images with easy adoption. The key idea is to shift the challenge of DP image synthesis from the image domain to the text domain by leveraging state of the art DP text generation methods. SPTI first summarizes each private image into a concise textual description using image to text models, then applies a modified Private Evolution algorithm to generate DP text, and finally reconstructs images using text to image models. Notably, SPTI requires no model training, only inference with off the shelf models. Given a private dataset, SPTI produces synthetic images of substantially higher quality than prior DP approaches. On the LSUN Bedroom dataset, SPTI attains an FID less than or equal to 26.71 under epsilon equal to 1.0, improving over Private Evolution FID of 40.36. Similarly, on MM CelebA HQ, SPTI achieves an FID less than or equal to 33.27 at epsilon equal to 1.0, compared to 57.01 from DP fine tuning baselines. Overall, our results demonstrate that Synthesis via Private Textual Intermediaries provides a resource efficient and proprietary model compatible framework for generating high resolution DP synthetic images, greatly expanding access to private visual datasets.
- Abstract(参考訳): 高忠実で微分プライベートな(DP)合成画像の生成は、個人のプライバシーを損なうことなく、機密性の高い視覚データを共有、分析するための有望な手段を提供する。
しかし、既存のDP画像合成法は、元のデータの構造を忠実に捉えた高解像度の出力を生成するのに苦労している。
本稿では,SPTI(Synsration via Private Textual Intermediaries)と呼ばれる新しい手法を提案する。
鍵となる考え方は、DP画像合成の課題を、最先端のDPテキスト生成手法を利用して、画像領域からテキスト領域にシフトさせることである。
SPTIはまず、各プライベート画像をテキストモデルに画像を用いた簡潔なテキスト記述に要約し、その後、修正されたPrivate Evolutionアルゴリズムを適用してDPテキストを生成し、最終的に画像モデルにテキストを使用したイメージを再構成する。
特に、SPTIはモデルトレーニングを必要とせず、市販モデルのみを推論する。
プライベートデータセットが与えられた場合、SPTIは以前のDPアプローチよりもかなり高品質な合成画像を生成する。
LSUNベッドルームデータセットでは、SPTIはエプシロンで26.71以下のFIDを1.0以下で達成し、40.36のPrivate Evolution FIDよりも改善している。
同様に、MM CelebA HQ では、SPTI は Epsilon で 33.27 未満の FID を DP の微調整ベースラインから 57.01 と比較すると、1.0 に等しい。
総合的な結果から,Private Textual Intermediariesによる合成は,高解像度のDP合成画像を生成するための資源効率が高く,プロプライエタリなモデル互換のフレームワークを提供し,プライベートなビジュアルデータセットへのアクセスを大幅に拡大することを示した。
関連論文リスト
- From Easy to Hard: Building a Shortcut for Differentially Private Image Synthesis [14.93795597224185]
差分プライベート(DP)画像合成は、センシティブなデータセットから合成画像を生成することを目的としている。
本稿では,拡散モデルを用いて合成画像を容易に生成する2段階のDP画像合成フレームワークを提案する。
我々は,4つの画像データセットの平均値において,合成画像の忠実度と有用度が,最先端の手法よりも33.1%,2.1%向上していることを示す実験を行った。
論文 参考訳(メタデータ) (2025-04-02T06:30:55Z) - Differentially Private Synthetic Data via Foundation Model APIs 2: Text [56.13240830670327]
現実世界で生成された高品質なテキストデータはプライベートであり、プライバシー上の懸念から自由に共有したり、利用したりすることはできない。
テキストの複雑な設定に適用可能な拡張PEアルゴリズムであるAug-PEを提案する。
その結果, Aug-PE は SOTA DP の微調整ベースラインと競合する DP 合成テキストを生成することがわかった。
論文 参考訳(メタデータ) (2024-03-04T05:57:50Z) - PrivImage: Differentially Private Synthetic Image Generation using Diffusion Models with Semantic-Aware Pretraining [13.823621924706348]
差分プライバシー(DP)画像データ合成により、企業はプライバシの懸念なしに合成画像を共有し、利用することができる。
従来の手法では、生成モデルの高度な技術と、公開データセットでの事前学習を取り入れて、例外的なDP画像データを生成する。
本稿では,事前学習データを慎重に選択する新しいDP画像合成手法PRIVIMAGEを提案する。
論文 参考訳(メタデータ) (2023-10-19T14:04:53Z) - DPAF: Image Synthesis via Differentially Private Aggregation in Forward
Phase [14.76128148793876]
DPAFは高次元画像合成のための効果的な微分プライベート生成モデルである。
クリッピング勾配における情報損失を低減し、アグリゲーションに対する感度を低下させる。
また、識別器の異なる部分を非対称に訓練する新しいトレーニング戦略を提案することにより、適切なバッチサイズを設定する問題にも対処する。
論文 参考訳(メタデータ) (2023-04-20T16:32:02Z) - Semantic-Guided Generative Image Augmentation Method with Diffusion
Models for Image Classification [48.640470032205265]
画像分類のための拡散モデルを用いた意味誘導型生成画像拡張法であるSGIDを提案する。
具体的には、SGIDは拡散モデルを用いて、画像の多様性に優れた拡張画像を生成する。さらに、画像ラベルとキャプションを、拡張画像とオリジナル画像のセマンティック一貫性を維持するためのガイダンスとして用いている。
論文 参考訳(メタデータ) (2023-02-04T02:47:41Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Towards Open-World Text-Guided Face Image Generation and Manipulation [52.83401421019309]
顔画像生成と操作の両方に統一的なフレームワークを提案する。
本手法は,画像とテキストの両方を含むオープンワールドシナリオをサポートし,再トレーニングや微調整,後処理は行わない。
論文 参考訳(メタデータ) (2021-04-18T16:56:07Z) - DF-GAN: A Simple and Effective Baseline for Text-to-Image Synthesis [80.54273334640285]
本稿では,異なる生成装置間の絡み合わずに高解像度画像を直接合成する,新しい1段階のテキスト・ツー・イメージバックボーンを提案する。
また,Matching-Aware Gradient Penalty と One-Way Output を組み合わせた新たなターゲット認識識別器を提案する。
現在の最先端手法と比較して,提案するDF-GANはよりシンプルだが,現実的およびテキストマッチング画像の合成には効率的である。
論文 参考訳(メタデータ) (2020-08-13T12:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。