論文の概要: From Easy to Hard++: Promoting Differentially Private Image Synthesis Through Spatial-Frequency Curriculum
- arxiv url: http://arxiv.org/abs/2601.06368v1
- Date: Sat, 10 Jan 2026 00:38:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.776883
- Title: From Easy to Hard++: Promoting Differentially Private Image Synthesis Through Spatial-Frequency Curriculum
- Title(参考訳): 簡単からハード++へ:空間周波数カリキュラムによる微分プライベート画像合成を促進する
- Authors: Chen Gong, Kecen Li, Zinan Lin, Tianhao Wang,
- Abstract要約: トレーニングショートカットとして周波数特徴を導入するFETA-Proを提案する。
FETA-Proは、最高性能のベースラインよりも平均25.7%の忠実度と4.1%の実用性を示している。
- 参考スコア(独自算出の注目度): 18.158096061348157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To improve the quality of Differentially private (DP) synthetic images, most studies have focused on improving the core optimization techniques (e.g., DP-SGD). Recently, we have witnessed a paradigm shift that takes these techniques off the shelf and studies how to use them together to achieve the best results. One notable work is DP-FETA, which proposes using `central images' for `warming up' the DP training and then using traditional DP-SGD. Inspired by DP-FETA, we are curious whether there are other such tools we can use together with DP-SGD. We first observe that using `central images' mainly works for datasets where there are many samples that look similar. To handle scenarios where images could vary significantly, we propose FETA-Pro, which introduces frequency features as `training shortcuts.' The complexity of frequency features lies between that of spatial features (captured by `central images') and full images, allowing for a finer-grained curriculum for DP training. To incorporate these two types of shortcuts together, one challenge is to handle the training discrepancy between spatial and frequency features. To address it, we leverage the pipeline generation property of generative models (instead of having one model trained with multiple features/objectives, we can have multiple models working on different features, then feed the generated results from one model into another) and use a more flexible design. Specifically, FETA-Pro introduces an auxiliary generator to produce images aligned with noisy frequency features. Then, another model is trained with these images, together with spatial features and DP-SGD. Evaluated across five sensitive image datasets, FETA-Pro shows an average of 25.7% higher fidelity and 4.1% greater utility than the best-performing baseline, under a privacy budget $ε= 1$.
- Abstract(参考訳): 微分プライベート(DP)合成画像の品質向上のため,多くの研究はコア最適化技術(DP-SGDなど)の改善に重点を置いている。
最近、私たちはこれらのテクニックを棚から取り除き、最良の結果を得るためにそれらを一緒に使う方法を研究するパラダイムシフトを目撃しました。
DP-FETAは、DPトレーニングの'ウォーミングアップ'に'central image'を使用し、続いて従来のDP-SGDを使用することを提案する。
DP-FETAにインスパイアされた私たちは、DP-SGDと一緒に使えるツールが他にあるかどうか疑問に思っています。
まず最初に、'central image'の使用は、よく似た多くのサンプルが存在するデータセットで主に動作することを観察する。
画像が著しく異なるシナリオを扱うために、周波数特徴を「トレーニングショートカット」として導入するFETA-Proを提案する。
「周波数特徴の複雑さは、空間的特徴(「中央画像」で捉えた)と全画像の間にあり、DP訓練のよりきめ細かいカリキュラムを可能にしている。」
これら2種類のショートカットを一体化するためには、空間的特徴と周波数的特徴との訓練の相違を扱うことが課題である。
これに対処するために、生成モデルのパイプライン生成特性(複数の機能/オブジェクトでトレーニングされた1つのモデルではなく、複数のモデルが異なる機能で作業し、生成された結果を別のモデルに供給し、より柔軟な設計を使用することができます。
具体的には、FETA-Proはノイズ周波数の特徴に沿った画像を生成する補助ジェネレータを導入している。
次に、空間的特徴とDP-SGDとともに、これらの画像を用いて別のモデルを訓練する。
5つの機密画像データセットで評価され、FETA-Proは平均25.7%の忠実度と4.1%の実用性を示し、プライバシー予算はε=1$である。
関連論文リスト
- From Easy to Hard: Building a Shortcut for Differentially Private Image Synthesis [14.93795597224185]
差分プライベート(DP)画像合成は、センシティブなデータセットから合成画像を生成することを目的としている。
本稿では,拡散モデルを用いて合成画像を容易に生成する2段階のDP画像合成フレームワークを提案する。
我々は,4つの画像データセットの平均値において,合成画像の忠実度と有用度が,最先端の手法よりも33.1%,2.1%向上していることを示す実験を行った。
論文 参考訳(メタデータ) (2025-04-02T06:30:55Z) - DPImageBench: A Unified Benchmark for Differentially Private Image Synthesis [18.158096061348157]
差分プライベート(DP)画像合成は、データセット内の個々の画像のプライバシーを保護しながら、機密画像の特性を保持する人工画像を生成することを目的としている。
近年の進歩にもかかわらず、不整合かつ時には欠陥のある評価プロトコルが研究全体で適用されている。
本稿では,DP画像合成のためのDPImageBenchについて述べる。
論文 参考訳(メタデータ) (2025-03-18T19:37:35Z) - One-Shot Learning for Pose-Guided Person Image Synthesis in the Wild [15.379362338850767]
現在のPGPIS(Pose-Guided Person Image Synthesis)法は、大量のラベル付き三重項データに大きく依存し、ジェネレータを教師付きで訓練する。
OnePoseTransは高品質なポーズ転送結果を生成し、最先端のデータ駆動方式よりも高い安定性を提供する。
テストケース毎に、OnePoseTransはNVIDIA V100 GPUで約48秒でモデルをカスタマイズする。
論文 参考訳(メタデータ) (2024-09-15T02:42:25Z) - Differentially Private Representation Learning via Image Captioning [51.45515227171524]
画像キャプションとインターネット規模のマルチモーダルデータセットのスケールアップにより,効率的なDP表現学習が可能であることを示す。
LAION-2Bの233Mサブセット上のDPイメージキャプタ(DP-Cap)を,合理的な計算量を用いてスクラッチからトレーニングした。
論文 参考訳(メタデータ) (2024-03-04T21:52:25Z) - Boosting Semi-Supervised 2D Human Pose Estimation by Revisiting Data Augmentation and Consistency Training [54.074020740827855]
SSHPEは、高度なデータ拡張と簡潔な一貫性のトレーニング方法という、2つのコアから強化できることがわかった。
このシンプルでコンパクトな設計は解釈可能であり、新しく発見された拡張の恩恵を受けやすい。
本研究は,従来の人体画像,魚眼画像,人手画像に対するアプローチの優位性と汎用性を広く検証する。
論文 参考訳(メタデータ) (2024-02-18T12:27:59Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - Collaborative Score Distillation for Consistent Visual Synthesis [70.29294250371312]
コラボレーティブスコア蒸留 (CSD) は, 定常変分勾配Descence (SVGD) に基づく。
本研究では,パノラマ画像,ビデオ,3Dシーンの視覚的編集を含む,様々な作業におけるCDDの有効性を示す。
本研究は,サンプル間の整合性を向上し,テキスト・画像拡散モデルの適用性を高めるための汎用手法として,CDDの能力について述べる。
論文 参考訳(メタデータ) (2023-07-04T17:31:50Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。