論文の概要: Evaluating Privacy-Utility Tradeoffs in Synthetic Smart Grid Data
- arxiv url: http://arxiv.org/abs/2506.11026v1
- Date: Tue, 20 May 2025 10:46:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.488659
- Title: Evaluating Privacy-Utility Tradeoffs in Synthetic Smart Grid Data
- Title(参考訳): スマートグリッドデータにおけるプライバシ-ユーティリティトレードオフの評価
- Authors: Andre Catarino, Rui Melo, Rui Abreu, Luis Cruz,
- Abstract要約: 4つの合成データ生成手法の比較評価を行った。
我々は,分類ユーティリティ,流通忠実度,プライバシリークを評価した。
これらの知見は、プライバシ保護、データ駆動型エネルギーシステムを開発するための構造化生成モデルの可能性を強調している。
- 参考スコア(独自算出の注目度): 9.927400227483428
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widespread adoption of dynamic Time-of-Use (dToU) electricity tariffs requires accurately identifying households that would benefit from such pricing structures. However, the use of real consumption data poses serious privacy concerns, motivating the adoption of synthetic alternatives. In this study, we conduct a comparative evaluation of four synthetic data generation methods, Wasserstein-GP Generative Adversarial Networks (WGAN), Conditional Tabular GAN (CTGAN), Diffusion Models, and Gaussian noise augmentation, under different synthetic regimes. We assess classification utility, distribution fidelity, and privacy leakage. Our results show that architectural design plays a key role: diffusion models achieve the highest utility (macro-F1 up to 88.2%), while CTGAN provide the strongest resistance to reconstruction attacks. These findings highlight the potential of structured generative models for developing privacy-preserving, data-driven energy systems.
- Abstract(参考訳): ダイナミック・タイム・オブ・ユース(dToU)電気関税が広く採用されるには、こうした価格体系の恩恵を受ける家庭を正確に特定する必要がある。
しかし、実際の消費データの使用は、深刻なプライバシー上の懸念を引き起こし、合成代替案の採用を動機付けている。
本研究では,WGAN(Wsserstein-GP Generative Adversarial Networks),CTGAN(Conditional Tabular GAN),拡散モデル(Diffusion Models),ガウス雑音増強(Gaussian noise augmentation)の4つの合成データ生成手法の比較評価を行った。
我々は,分類ユーティリティ,流通忠実度,プライバシリークを評価した。
拡散モデルが最も有用(マクロF1は最大88.2%)であるのに対し,CTGANはリコンストラクション攻撃に対する強い抵抗を提供する。
これらの知見は、プライバシ保護とデータ駆動型エネルギーシステムを開発するための構造化生成モデルの可能性を強調している。
関連論文リスト
- Little Giants: Synthesizing High-Quality Embedding Data at Scale [71.352883755806]
SPEEDは,オープンソースの小型モデルと協調して大規模な埋め込みデータを効率的に生成するフレームワークである。
SPEEDはGPT API呼び出しの1/10未満しか使用せず、両者が合成データのみに基づいてトレーニングされている場合、最先端の埋め込みモデルE5_mistralよりも優れている。
論文 参考訳(メタデータ) (2024-10-24T10:47:30Z) - Synthetic Data Generation for Residential Load Patterns via Recurrent GAN and Ensemble Method [12.161170324762645]
我々は,高忠実性合成住宅負荷データを生成するために,ERGAN(Ensemble Recurrent Generative Adversarial Network)フレームワークを開発した。
開発したERGANは, 様々な家庭で多様な負荷パターンを捕捉し, 生成した合成データの現実性と多様性を向上させる。
論文 参考訳(メタデータ) (2024-10-20T12:33:38Z) - CasTGAN: Cascaded Generative Adversarial Network for Realistic Tabular
Data Synthesis [0.4999814847776097]
近年,GAN(Generative Adversarial Network)が注目されている。
合成データの妥当性と基礎となるプライバシーに関する懸念は、十分に対処されていない主要な課題を表している。
論文 参考訳(メタデータ) (2023-07-01T16:52:18Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Synthesizing Mixed-type Electronic Health Records using Diffusion Models [10.973115905786129]
合成データ生成は、機密性の高い患者情報を共有する際のプライバシー上の懸念を軽減するための有望なソリューションである。
近年の研究では、拡散モデルは、より現実的な合成データの生成や、画像、テキスト、音声などのデータモダリティの生成における安定したトレーニングなど、GANに対していくつかの利点があることが示された。
実験の結果,TabDDPMは,プライバシーとユーティリティのトレードオフを確認するプライバシー以外のすべての評価指標において,最先端モデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-28T15:42:30Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited
Data [125.7135706352493]
GAN(Generative Adversarial Network)は、高忠実度画像を合成するために、訓練に十分なデータを必要とする。
近年の研究では、差別者の過度な適合により、限られたデータでGANを訓練することは困難であることが示されている。
本稿では,APA (Adaptive Pseudo Augmentation) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-12T18:13:45Z) - Discriminator Contrastive Divergence: Semi-Amortized Generative Modeling
by Exploring Energy of the Discriminator [85.68825725223873]
GAN(Generative Adversarial Networks)は、高次元データのモデリングにおいて大きな可能性を秘めている。
本稿では,WGANの識別器の特性を活かした識別器コントラストの多様性について紹介する。
我々は、合成データと実世界の画像生成ベンチマークの両方において、大幅に改善された生成の利点を実証する。
論文 参考訳(メタデータ) (2020-04-05T01:50:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。