論文の概要: Empirical Evaluation of Structured Synthetic Data Privacy Metrics: Novel experimental framework
- arxiv url: http://arxiv.org/abs/2512.16284v1
- Date: Thu, 18 Dec 2025 08:09:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:31.977282
- Title: Empirical Evaluation of Structured Synthetic Data Privacy Metrics: Novel experimental framework
- Title(参考訳): 構造化合成データプライバシメトリクスの実証評価:新しい実験フレームワーク
- Authors: Milton Nicolás Plasencia Palacios, Alexander Boudewijn, Sebastiano Saccani, Andrea Filippo Ferraris, Diana Sofronieva, Giuseppe D'Acquisto, Filiberto Brozzetti, Daniele Panfilo, Luca Bortolussi,
- Abstract要約: プライバシー強化技術として、合成データ生成が注目を集めている。
データプライバシの概念はいまだ解明されていないため、実践者が合成データが提供するプライバシ保護の程度を評価し、ベンチマークすることは困難である。
- 参考スコア(独自算出の注目度): 34.56525983543448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetic data generation is gaining traction as a privacy enhancing technology (PET). When properly generated, synthetic data preserve the analytic utility of real data while avoiding the retention of information that would allow the identification of specific individuals. However, the concept of data privacy remains elusive, making it challenging for practitioners to evaluate and benchmark the degree of privacy protection offered by synthetic data. In this paper, we propose a framework to empirically assess the efficacy of tabular synthetic data privacy quantification methods through controlled, deliberate risk insertion. To demonstrate this framework, we survey existing approaches to synthetic data privacy quantification and the related legal theory. We then apply the framework to the main privacy quantification methods with no-box threat models on publicly available datasets.
- Abstract(参考訳): 合成データ生成は、プライバシー向上技術(PET)として注目を集めている。
適切に生成されると、合成データは、特定の個人を識別できる情報の保持を回避しながら、実際のデータの分析的有用性を保っている。
しかし、データプライバシの概念はいまだ解明されていないため、実践者が合成データによって提供されるプライバシ保護の程度を評価し、ベンチマークすることは困難である。
本稿では,制御されたリスク挿入による表型合成データプライバシー定量化手法の有効性を実証的に評価する枠組みを提案する。
この枠組みを実証するために、合成データプライバシーの定量化と関連する法理論に関する既存のアプローチを調査した。
次に、このフレームワークを、公開データセット上のNo-box脅威モデルを持つ主要なプライバシ定量化手法に適用する。
関連論文リスト
- How to DP-fy Your Data: A Practical Guide to Generating Synthetic Data With Differential Privacy [52.00934156883483]
Differential Privacy(DP)は、情報漏洩を推論し、制限するフレームワークである。
Differentially Private Synthetic Dataは、ソースデータの全体的なトレンドを保存する合成データを指す。
論文 参考訳(メタデータ) (2025-12-02T21:14:39Z) - Aim High, Stay Private: Differentially Private Synthetic Data Enables Public Release of Behavioral Health Information with High Utility [2.1715431485081593]
差別化プライバシ(DP)は、再識別リスクに対する正式な保証を提供する。
我々は、リングスタディ(LEMURS)を用いて測定されたライブ体験の第1相のDP合成データを生成する。
LEMURSデータセットの実際の使用状況から情報を得たフレームワークを用いて,合成データの有用性を評価する。
論文 参考訳(メタデータ) (2025-06-30T15:58:34Z) - A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-level Privacy Leakage [77.83757117924995]
我々は、データリリース時の個人のプライバシーリスクを定量化するために、再識別攻撃を評価する新しいフレームワークを提案する。
本手法は, 衛生データから年齢や物質使用履歴などのセンシティブな属性を推測するために, 一見無害な補助情報を利用できることを示す。
論文 参考訳(メタデータ) (2025-04-28T01:16:27Z) - A Consensus Privacy Metrics Framework for Synthetic Data [13.972528788909813]
合成データのプライバシーを測定するための統合された標準は存在しない。
以上の結果から,現在の類似度指標は個人情報の開示を測ることが困難であることが示唆された。
異なるプライベートな合成データについては、ゼロに近いプライバシー予算は解釈できないと考えられていた。
論文 参考訳(メタデータ) (2025-03-06T21:19:02Z) - Tabular Data Synthesis with Differential Privacy: A Survey [24.500349285858597]
データ共有はコラボレーティブなイノベーションの前提条件であり、さまざまなデータセットを活用して深い洞察を得ることを可能にします。
データ合成は、実際のデータの統計特性を保存する人工データセットを生成することで、この問題に対処する。
プライバシーに配慮したデータ共有に対する、有望なアプローチとして、異なるプライベートなデータ合成が登場している。
論文 参考訳(メタデータ) (2024-11-04T06:32:48Z) - Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z) - Fidelity and Privacy of Synthetic Medical Data [0.0]
医療記録のデジタル化は、新時代のビッグデータから臨床科学へとつながった。
個々のレベルの医療データを共有する必要性は増え続けており、これ以上緊急ではない。
ビッグデータの利用に対する熱意は、患者の自律性とプライバシに対する完全な適切な懸念によって誘惑された。
論文 参考訳(メタデータ) (2021-01-18T23:01:27Z) - Really Useful Synthetic Data -- A Framework to Evaluate the Quality of
Differentially Private Synthetic Data [2.538209532048867]
プライバシ保護の原則を付加する合成データ生成の最近の進歩は、プライバシ保護の方法で統計情報を共有するための重要なステップである。
データプライバシとデータ品質のトレードオフを最適化するためには、後者について詳しく考える必要があります。
本研究では,応用研究者の視点から,差分的にプライベートな合成データの質を評価する枠組みを開発する。
論文 参考訳(メタデータ) (2020-04-16T16:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。