論文の概要: Differential Privacy of Hierarchical Census Data: An Optimization
Approach
- arxiv url: http://arxiv.org/abs/2006.15673v2
- Date: Sun, 9 May 2021 20:02:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 02:59:01.260909
- Title: Differential Privacy of Hierarchical Census Data: An Optimization
Approach
- Title(参考訳): 階層的国勢調査データの微分プライバシー:最適化アプローチ
- Authors: Ferdinando Fioretto, Pascal Van Hentenryck, Keyu Zhu
- Abstract要約: 国勢調査局(Census Bureaus)は、個人に関する機密情報を明らかにすることなく、大人口に関する社会経済的データをまとめて公開することに興味を持っている。
最近の出来事では、これらの組織が直面しているプライバシー上の課題がいくつか特定されている。
本稿では,階層的な個人数を解放する新たな差分プライバシ機構を提案する。
- 参考スコア(独自算出の注目度): 53.29035917495491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper is motivated by applications of a Census Bureau interested in
releasing aggregate socio-economic data about a large population without
revealing sensitive information about any individual. The released information
can be the number of individuals living alone, the number of cars they own, or
their salary brackets. Recent events have identified some of the privacy
challenges faced by these organizations. To address them, this paper presents a
novel differential-privacy mechanism for releasing hierarchical counts of
individuals. The counts are reported at multiple granularities (e.g., the
national, state, and county levels) and must be consistent across all levels.
The core of the mechanism is an optimization model that redistributes the noise
introduced to achieve differential privacy in order to meet the consistency
constraints between the hierarchical levels. The key technical contribution of
the paper shows that this optimization problem can be solved in polynomial time
by exploiting the structure of its cost functions. Experimental results on very
large, real datasets show that the proposed mechanism provides improvements of
up to two orders of magnitude in terms of computational efficiency and accuracy
with respect to other state-of-the-art techniques.
- Abstract(参考訳): 本稿は,人口の全体的社会経済データを公表することに関心のある国勢調査局の応用に動機づけられたものである。
公表された情報は、一人暮らしの個人数、所有する車の数、給与の括弧などだ。
最近の出来事は、これらの組織が直面しているプライバシー問題の一部を特定している。
そこで本稿では,個人の階層的数を解放する新しい差分プライバシーメカニズムを提案する。
カウントは複数の粒度(例えば、国、州、郡レベル)で報告され、すべてのレベルにわたって一貫性を持たなければならない。
メカニズムのコアは、階層レベルの一貫性の制約を満たすために、差分プライバシーを達成するために導入されたノイズを再分配する最適化モデルである。
本論文の技術的貢献は, この最適化問題を, コスト関数の構造を利用して多項式時間で解くことができることを示している。
非常に大きな実データセットによる実験結果から,提案手法は,他の最先端技術と比較して,計算効率と精度の点で最大2桁の精度向上をもたらすことが示された。
関連論文リスト
- A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。
これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。
差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文 参考訳(メタデータ) (2023-09-27T14:38:16Z) - Continual Release of Differentially Private Synthetic Data [31.37064398694776]
微分プライベートな合成データを連続的にリリースする問題について検討する。
各ステップごとに、各ステップが新しいデータ要素をレポートするモデルを導入します。
本稿では,2種類のクエリを連続的に保存する合成データ生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-13T16:22:08Z) - Differential Privacy via Distributionally Robust Optimization [6.080354168357744]
非漸近的かつ無条件の最適性を保証するメカニズムのクラスを開発する。
上界 (primal) は実装可能な摂動に対応しており、その準最適性は下界 (dual) で有界である。
数値実験により、我々の摂動は、人工的および標準ベンチマーク問題に関する文献から得られた最も優れた結果よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-04-25T09:31:47Z) - Differentially Private Federated Clustering over Non-IID Data [59.611244450530315]
クラスタリングクラスタ(FedC)問題は、巨大なクライアント上に分散されたラベルなしデータサンプルを、サーバのオーケストレーションの下で有限のクライアントに正確に分割することを目的としている。
本稿では,DP-Fedと呼ばれる差分プライバシー収束手法を用いた新しいFedCアルゴリズムを提案する。
提案するDP-Fedの様々な属性は、プライバシー保護の理論的解析、特に非識別的かつ独立に分散された(非i.d.)データの場合において得られる。
論文 参考訳(メタデータ) (2023-01-03T05:38:43Z) - DP2-Pub: Differentially Private High-Dimensional Data Publication with
Invariant Post Randomization [58.155151571362914]
本稿では,2つのフェーズで動作する差分プライベートな高次元データパブリッシング機構(DP2-Pub)を提案する。
属性をクラスタ内凝集度の高い低次元クラスタに分割し、クラスタ間の結合度を低くすることで、適切なプライバシ予算を得ることができる。
また、DP2-Pubメカニズムを、ローカルの差分プライバシーを満たす半正直なサーバでシナリオに拡張します。
論文 参考訳(メタデータ) (2022-08-24T17:52:43Z) - Post-processing of Differentially Private Data: A Fairness Perspective [53.29035917495491]
本稿では,ポストプロセッシングが個人やグループに異なる影響を与えることを示す。
差分的にプライベートなデータセットのリリースと、ダウンストリームの決定にそのようなプライベートなデータセットを使用するという、2つの重要な設定を分析している。
それは、異なる公正度尺度の下で(ほぼ)最適である新しい後処理機構を提案する。
論文 参考訳(メタデータ) (2022-01-24T02:45:03Z) - Robust and Differentially Private Mean Estimation [40.323756738056616]
異なるプライバシーは、米国国勢調査から商用デバイスで収集されたデータまで、さまざまなアプリケーションで標準要件として浮上しています。
このようなデータベースの数は、複数のソースからのデータからなり、それらすべてが信頼できるわけではない。
これにより、既存のプライベート分析は、腐敗したデータを注入する敵による攻撃に弱い。
論文 参考訳(メタデータ) (2021-02-18T05:02:49Z) - Graph-Homomorphic Perturbations for Private Decentralized Learning [64.26238893241322]
ローカルな見積もりの交換は、プライベートデータに基づくデータの推測を可能にする。
すべてのエージェントで独立して選択された摂動により、パフォーマンスが著しく低下する。
本稿では,特定のヌル空間条件に従って摂動を構成する代替スキームを提案する。
論文 参考訳(メタデータ) (2020-10-23T10:35:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。