論文の概要: PHSafe: Disclosure Avoidance for the 2020 Census Supplemental Demographic and Housing Characteristics File (S-DHC)
- arxiv url: http://arxiv.org/abs/2505.01254v1
- Date: Fri, 02 May 2025 13:20:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-05 17:21:20.032443
- Title: PHSafe: Disclosure Avoidance for the 2020 Census Supplemental Demographic and Housing Characteristics File (S-DHC)
- Title(参考訳): PHSafe:2020 Census Supplemental Demographic and Housing Characteristics File (S-DHC)の開示回避
- Authors: William Sexton, Skye Berghel, Bayard Carlson, Sam Haney, Luke Hartman, Michael Hay, Ashwin Machanavajjhala, Gerome Miklau, Amritha Pai, Simran Rajpal, David Pujol, Ruchit Shrestha, Daniel Simmons-Marengo,
- Abstract要約: 本稿では、離散ガウス分布から引き出された雑音を興味のある統計に付加するPHSafeアルゴリズムについて述べる。
このアルゴリズムは、ゼロ集中差分プライバシーと呼ばれる、よく研究されている差分プライバシーの変種を満たすことを証明している。
- 参考スコア(独自算出の注目度): 7.7544849165583525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This article describes the disclosure avoidance algorithm that the U.S. Census Bureau used to protect the 2020 Census Supplemental Demographic and Housing Characteristics File (S-DHC). The tabulations contain statistics of counts of U.S. persons living in certain types of households, including averages. The article describes the PHSafe algorithm, which is based on adding noise drawn from a discrete Gaussian distribution to the statistics of interest. We prove that the algorithm satisfies a well-studied variant of differential privacy, called zero-concentrated differential privacy. We then describe how the algorithm was implemented on Tumult Analytics and briefly outline the parameterization and tuning of the algorithm.
- Abstract(参考訳): 本稿は、米国国勢調査局が2020年国勢調査補助デモグラフィー・ハウジング特性ファイル(S-DHC)を保護するために使用した開示回避アルゴリズムについて述べる。
この表には、平均を含む特定の種類の世帯に住むアメリカ人の数の統計が含まれている。
本稿では、離散ガウス分布から引き出された雑音を興味のある統計に付加するPHSafeアルゴリズムについて述べる。
このアルゴリズムは、ゼロ集中差分プライバシーと呼ばれる、よく研究されている差分プライバシーの変種を満たすことを証明している。
次に、アルゴリズムがTumult Analytics上でどのように実装されたかを説明し、アルゴリズムのパラメータ化とチューニングについて概説する。
関連論文リスト
- Linear-Time User-Level DP-SCO via Robust Statistics [55.350093142673316]
ユーザレベルの差分プライベート凸最適化(DP-SCO)は、マシンラーニングアプリケーションにおけるユーザのプライバシ保護の重要性から、大きな注目を集めている。
微分プライベート勾配勾配(DP-SGD)に基づくような現在の手法は、しばしば高雑音蓄積と準最適利用に苦しむ。
これらの課題を克服するために、ロバストな統計、特に中央値とトリミング平均を利用する新しい線形時間アルゴリズムを導入する。
論文 参考訳(メタデータ) (2025-02-13T02:05:45Z) - Evaluating the Impacts of Swapping on the US Decennial Census [7.020785266789317]
我々は,Censusの出版物,裁判所文書,およびCensusの従業員に対する非公式なインタビューに基づいて,パラメータ化スワップアルゴリズムを記述し,実装する。
我々は、TopDownが導入したシフトのタイプをスワップして比較することで、シフトのタイプを直観する。
論文 参考訳(メタデータ) (2025-02-03T12:51:16Z) - Data value estimation on private gradients [84.966853523107]
勾配に基づく機械学習(ML)法では、デファクト微分プライバシー技術がランダムノイズで勾配を乱している。
データバリュエーションは、トレーニングデータにMLのパフォーマンスを特性付け、DPの強制を必要とするプライバシーに配慮したアプリケーションで広く使用されている。
我々は,データ値推定の不確かさをパラドックス的に線形に評価し,評価予算を増大させるため,勾配に不規則な雑音を注入するというデフォルトのアプローチを伴わないことを示す。
提案手法は, 予測の不確実性の線形化を確実に除去するために, 慎重に相関ノイズを注入することである。
論文 参考訳(メタデータ) (2024-12-22T13:15:51Z) - The 2020 United States Decennial Census Is More Private Than You (Might) Think [25.32778927275117]
2020年の米国国勢調査は、その名目上の保証が示すよりもはるかに強力なプライバシー保護を提供している。
ノイズのばらつきを15.08%$から24.82%$に減らし、地理的レベルごとにほぼ同じレベルのプライバシー保護を維持できることを示した。
論文 参考訳(メタデータ) (2024-10-11T23:06:15Z) - Synthetic Census Data Generation via Multidimensional Multiset Sum [7.900694093691988]
我々は、Censusの統計データのみから合成マイクロデータを生成するツールを提供する。
我々は,本手法が実際にうまく機能していることを示し,その性能を説明する理論的議論を行う。
論文 参考訳(メタデータ) (2024-04-15T19:06:37Z) - Comment: The Essential Role of Policy Evaluation for the 2020 Census
Disclosure Avoidance System [0.0]
Boyd and Sarathy, "Differential Perspectives: Epistemic Disconnects around around the US Census Bureau's Use of Differential Privacy"
Census Disclosure Avoidance Systemの実証的な評価は、ベンチマークデータが人口数の基本的真実ではないことを認識できなかった、と我々は主張する。
データユーティリティとプライバシ保護の間には、政策立案者が重要なトレードオフに直面しなければならない、と我々は主張する。
論文 参考訳(メタデータ) (2022-10-15T21:41:54Z) - Differentially Private Stochastic Gradient Descent with Low-Noise [49.981789906200035]
現代の機械学習アルゴリズムは、データからきめ細かい情報を抽出して正確な予測を提供することを目的としており、プライバシー保護の目標と矛盾することが多い。
本稿では、プライバシを保ちながら優れたパフォーマンスを確保するために、プライバシを保存する機械学習アルゴリズムを開発することの実践的および理論的重要性について論じる。
論文 参考訳(メタデータ) (2022-09-09T08:54:13Z) - Partial sensitivity analysis in differential privacy [58.730520380312676]
それぞれの入力特徴が個人のプライバシ損失に与える影響について検討する。
プライベートデータベース上でのクエリに対する我々のアプローチを実験的に評価する。
また、合成データにおけるニューラルネットワークトレーニングの文脈における知見についても検討する。
論文 参考訳(メタデータ) (2021-09-22T08:29:16Z) - Smoothed Differential Privacy [55.415581832037084]
微分プライバシー(DP)は、最悪のケース分析に基づいて広く受け入れられ、広く適用されているプライバシーの概念である。
本稿では, 祝賀されたスムーズな解析の背景にある最悪の平均ケースのアイデアに倣って, DPの自然な拡張を提案する。
サンプリング手順による離散的なメカニズムはDPが予測するよりもプライベートであるのに対して,サンプリング手順による連続的なメカニズムはスムーズなDP下では依然としてプライベートではないことが証明された。
論文 参考訳(メタデータ) (2021-07-04T06:55:45Z) - The Impact of the U.S. Census Disclosure Avoidance System on
Redistricting and Voting Rights Analysis [0.0]
米国国勢調査局は、2020年国勢調査の回答者のプライバシーを、情報開示回避システム(DAS)を通じて保護する計画だ。
保護されたデータは、目的を再限定するのに十分な品質ではないことが分かりました。
分析の結果,DASが保護するデータは,投票者の投票率や党派・人種構成に応じて,特定の領域に偏っていることがわかった。
論文 参考訳(メタデータ) (2021-05-29T03:32:36Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。