論文の概要: The 2010 Census Confidentiality Protections Failed, Here's How and Why
- arxiv url: http://arxiv.org/abs/2312.11283v1
- Date: Mon, 18 Dec 2023 15:23:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 11:57:39.067842
- Title: The 2010 Census Confidentiality Protections Failed, Here's How and Why
- Title(参考訳): 2010年国勢調査の機密性保護が失敗した理由と理由
- Authors: John M. Abowd, Tamara Adams, Robert Ashmead, David Darais, Sourya Dey, Simson L. Garfinkel, Nathan Goldschlag, Daniel Kifer, Philip Leclerc, Ethan Lew, Scott Moore, Rolando A. Rodríguez, Ramy N. Tadros, Lars Vilhuber,
- Abstract要約: 我々は,2010年の国勢調査人事記録において,5つの変数(性ブロック,性別,年齢,人種,民族)を再構築した。
公開されたデータのみを使用して、攻撃者はすべての国勢調査ブロック(9700万人)の70%のレコードが完全に再構築されていることを確認できる。
我々は、2020年の国勢調査開示回避システム(Census Disclosure Avoidance System)の代替案も、同様の精度(交換の強化)で機密性を保護することができないことを示した。
- 参考スコア(独自算出の注目度): 6.982581904789855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Using only 34 published tables, we reconstruct five variables (census block, sex, age, race, and ethnicity) in the confidential 2010 Census person records. Using the 38-bin age variable tabulated at the census block level, at most 20.1% of reconstructed records can differ from their confidential source on even a single value for these five variables. Using only published data, an attacker can verify that all records in 70% of all census blocks (97 million people) are perfectly reconstructed. The tabular publications in Summary File 1 thus have prohibited disclosure risk similar to the unreleased confidential microdata. Reidentification studies confirm that an attacker can, within blocks with perfect reconstruction accuracy, correctly infer the actual census response on race and ethnicity for 3.4 million vulnerable population uniques (persons with nonmodal characteristics) with 95% accuracy, the same precision as the confidential data achieve and far greater than statistical baselines. The flaw in the 2010 Census framework was the assumption that aggregation prevented accurate microdata reconstruction, justifying weaker disclosure limitation methods than were applied to 2010 Census public microdata. The framework used for 2020 Census publications defends against attacks that are based on reconstruction, as we also demonstrate here. Finally, we show that alternatives to the 2020 Census Disclosure Avoidance System with similar accuracy (enhanced swapping) also fail to protect confidentiality, and those that partially defend against reconstruction attacks (incomplete suppression implementations) destroy the primary statutory use case: data for redistricting all legislatures in the country in compliance with the 1965 Voting Rights Act.
- Abstract(参考訳): 2010年の国勢調査人事記録では、わずか34の表を用いて、5つの変数(センサス・ブロック、セックス、年齢、人種、民族)を再構築した。
国勢調査ブロックレベルで集計された38ビンの年齢変数を使用して、少なくとも20.1%の再構成された記録は、これらの5つの変数の1つの値でさえも、秘密のソースと異なる可能性がある。
公開されたデータのみを使用して、攻撃者はすべての国勢調査ブロック(9700万人)の70%のレコードが完全に再構築されていることを確認できる。
従って、概要ファイル1の表面刊行物は、未公表の機密マイクロデータと同様の開示リスクを禁止している。
再確認調査では、攻撃者が完全な復元精度でブロック内で、人種と民族に関する実際の国勢調査応答を、95%の正確さで340万の脆弱な個体群(非モダクティブな特徴を持つ人物)に対して正確に推測できることを確認した。
2010年のCensusフレームワークの欠陥は、アグリゲーションが正確なマイクロデータ再構成を妨げ、2010年のCensus Public Microdataよりも弱い開示制限法を正当化する、という仮定であった。
以下に示すように、2020年国勢調査で使用されるフレームワークは、再構築に基づく攻撃を防御するものだ。
最後に、2020年国勢調査開示回避制度に類似した精度(交換の強化)の代替案も機密性保護に失敗し、復興攻撃(不完全な弾圧実施)を部分的に擁護する者は、1965年投票権法に従って国内すべての立法府を再分権するデータである第一の法定ユースケースを破壊していることを示す。
関連論文リスト
- Pseudo-Probability Unlearning: Towards Efficient and Privacy-Preserving Machine Unlearning [59.29849532966454]
本稿では,PseudoProbability Unlearning (PPU)を提案する。
提案手法は,最先端の手法に比べて20%以上の誤りを忘れる改善を実現している。
論文 参考訳(メタデータ) (2024-11-04T21:27:06Z) - The 2020 United States Decennial Census Is More Private Than You (Might) Think [25.32778927275117]
我々は、2020年国勢調査のプライバシー予算の8.50%から13.76%が8つの地理的レベルごとに使われていないことを示した。
我々は、地理的レベルで同じプライバシー予算を維持しながら、ノイズ分散を15.08%から24.82%削減する。
論文 参考訳(メタデータ) (2024-10-11T23:06:15Z) - Understanding and Mitigating the Impacts of Differentially Private Census Data on State Level Redistricting [4.589972411795548]
データ利用者は、2020年のDASで差分プライバシーを採用したことで動揺した。
我々は、プライバシー保護ノイズの影響について、データユーザーが懸念する可能性のある2つの再制限設定について検討する。
ノイズを考慮しなければ、アナリストが誤った結論を出す可能性があることを観察する。
論文 参考訳(メタデータ) (2024-09-10T18:11:54Z) - Noisy Measurements Are Important, the Design of Census Products Is Much More Important [1.52292571922932]
McCartan et al. (2023) は「国勢調査データユーザーのための差分プライバシー業務」を要求している。
このコメントは、2020年の国勢調査ノイズ計測ファイル(NMFs)が、この嘆願の最良の焦点ではない理由を説明している。
論文 参考訳(メタデータ) (2023-12-20T15:43:04Z) - An Examination of the Alleged Privacy Threats of Confidence-Ranked Reconstruction of Census Microdata [3.2156268397508314]
提案手法は, 著者が主張する情報開示に有効でないことを示す。
提案するランキングが再確認や情報開示攻撃を導くことができないことを示す実証的な結果が報告される。
論文 参考訳(メタデータ) (2023-11-06T15:04:03Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Confidence-Ranked Reconstruction of Census Microdata from Published
Statistics [45.39928315344449]
プライベートデータセットに対する再構築攻撃は、データセットに関する公開アクセス情報を入力する。
我々の攻撃は、集約されたクエリ統計量$Q(D)Rmm$から全行を再構築できるだけでなく、その確率で確実に復元された行をランク付けできることを示す。
当社の攻撃は、公開ディストリビューションや、プライベートデータセットである$D$がサンプリングされた人口へのアクセスのみに基づく攻撃よりもはるかに優れています。
論文 参考訳(メタデータ) (2022-11-06T14:08:43Z) - No Free Lunch in "Privacy for Free: How does Dataset Condensation Help
Privacy" [75.98836424725437]
データプライバシを保護するために設計された新しい手法は、慎重に精査する必要がある。
プライバシ保護の失敗は検出し難いが,プライバシ保護法を実装したシステムが攻撃された場合,破滅的な結果につながる可能性がある。
論文 参考訳(メタデータ) (2022-09-29T17:50:23Z) - Releasing survey microdata with exact cluster locations and additional
privacy safeguards [77.34726150561087]
本稿では,プライバシ保護を付加した独自のマイクロデータの有用性を活用した,代替的なマイクロデータ配信戦略を提案する。
当社の戦略は, 再識別の試みにおいても, 任意の属性に対する再識別リスクを60~80%削減する。
論文 参考訳(メタデータ) (2022-05-24T19:37:11Z) - The Impact of the U.S. Census Disclosure Avoidance System on
Redistricting and Voting Rights Analysis [0.0]
米国国勢調査局は、2020年国勢調査の回答者のプライバシーを、情報開示回避システム(DAS)を通じて保護する計画だ。
保護されたデータは、目的を再限定するのに十分な品質ではないことが分かりました。
分析の結果,DASが保護するデータは,投票者の投票率や党派・人種構成に応じて,特定の領域に偏っていることがわかった。
論文 参考訳(メタデータ) (2021-05-29T03:32:36Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。