論文の概要: A Simulated Reconstruction and Reidentification Attack on the 2010 U.S. Census
- arxiv url: http://arxiv.org/abs/2312.11283v3
- Date: Mon, 28 Jul 2025 11:10:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 14:15:44.554579
- Title: A Simulated Reconstruction and Reidentification Attack on the 2010 U.S. Census
- Title(参考訳): 2010年アメリカ合衆国国勢調査における再現と再確認攻撃のシミュレーション
- Authors: John M. Abowd, Tamara Adams, Robert Ashmead, David Darais, Sourya Dey, Simson L. Garfinkel, Nathan Goldschlag, Michael B. Hawes, Daniel Kifer, Philip Leclerc, Ethan Lew, Scott Moore, Rolando A. Rodríguez, Ramy N. Tadros, Lars Vilhuber,
- Abstract要約: 2010年国勢調査の個々の機密マイクロデータ記録を正確に再構築できることを示す。
9700万人の記録(すべての国勢調査ブロックの70%に居住している)は、公的な情報のみを使用して証明可能な確実性で正確に再構築されている。
差分プライバシーフレームワークに基づく2020年国勢調査で使用される手法は、可能な代替手段よりも、より正確なデータ精度で、この種の攻撃に対してより優れた保護を提供することを示す。
- 参考スコア(独自算出の注目度): 6.851716728384597
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We show that individual, confidential microdata records from the 2010 U.S. Census of Population and Housing can be accurately reconstructed from the published tabular summaries. Ninety-seven million person records (every resident in 70% of all census blocks) are exactly reconstructed with provable certainty using only public information. We further show that a hypothetical attacker using our methods can reidentify with 95% accuracy population unique individuals who are perfectly reconstructed and not in the modal race and ethnicity category in their census block (3.4 million persons)--a result that is only possible because their confidential records were used in the published tabulations. Finally, we show that the methods used for the 2020 Census, based on a differential privacy framework, provide better protection against this type of attack, with better published data accuracy, than feasible alternatives.
- Abstract(参考訳): 2010年アメリカ合衆国人口・住宅統計局の個人機密マイクロデータ記録は、発行された表表から正確に再構成可能であることを示す。
9700万人の記録(すべての国勢調査ブロックの70%に居住している)は、公的な情報のみを使用して証明可能な確実性で正確に再構築されている。
さらに,本手法を用いた仮説的攻撃者は,全人口の95%が完全に再構成され,人口ブロックの人種・民族区分に含まれていないことを,95%の精度で再同定できることを示した。
最後に、2020年国勢調査で使用される手法は、異なるプライバシーフレームワークに基づいて、この種の攻撃に対してより優れた保護を提供し、データ精度が、実現可能な代替手段よりも優れていることを示す。
関連論文リスト
- Generate-then-Verify: Reconstructing Data from Limited Published Statistics [22.649631494395653]
我々は、多くの可能なデータセットが公表された統計に一致し、プライベートデータセット全体を完璧に再構築することが不可能な体制に焦点を当てる。
まず、$textbfgenerates$一組のクレームを、次に$textbfverify$各クレームがすべての可能なデータセットに対して保持するかどうかを判断する、新しい整数プログラミング手法を導入します。
我々は、米国の十年国勢調査のリリースによる住宅レベルのマイクロデータに対する我々のアプローチを評価し、そのようなデータに関する情報が比較的少ない場合でも、プライバシー侵害は継続可能であることを実証した。
論文 参考訳(メタデータ) (2025-04-29T22:06:04Z) - Pseudo-Probability Unlearning: Towards Efficient and Privacy-Preserving Machine Unlearning [59.29849532966454]
本稿では,PseudoProbability Unlearning (PPU)を提案する。
提案手法は,最先端の手法に比べて20%以上の誤りを忘れる改善を実現している。
論文 参考訳(メタデータ) (2024-11-04T21:27:06Z) - The 2020 United States Decennial Census Is More Private Than You (Might) Think [25.32778927275117]
我々は、2020年国勢調査のプライバシー予算の8.50%から13.76%が8つの地理的レベルごとに使われていないことを示した。
我々は、地理的レベルで同じプライバシー予算を維持しながら、ノイズ分散を15.08%から24.82%削減する。
論文 参考訳(メタデータ) (2024-10-11T23:06:15Z) - Understanding and Mitigating the Impacts of Differentially Private Census Data on State Level Redistricting [4.589972411795548]
データ利用者は、2020年のDASで差分プライバシーを採用したことで動揺した。
我々は、プライバシー保護ノイズの影響について、データユーザーが懸念する可能性のある2つの再制限設定について検討する。
ノイズを考慮しなければ、アナリストが誤った結論を出す可能性があることを観察する。
論文 参考訳(メタデータ) (2024-09-10T18:11:54Z) - Noisy Measurements Are Important, the Design of Census Products Is Much More Important [1.52292571922932]
McCartan et al. (2023) は「国勢調査データユーザーのための差分プライバシー業務」を要求している。
このコメントは、2020年の国勢調査ノイズ計測ファイル(NMFs)が、この嘆願の最良の焦点ではない理由を説明している。
論文 参考訳(メタデータ) (2023-12-20T15:43:04Z) - An Examination of the Alleged Privacy Threats of Confidence-Ranked Reconstruction of Census Microdata [3.2156268397508314]
提案手法は, 著者が主張する情報開示に有効でないことを示す。
提案するランキングが再確認や情報開示攻撃を導くことができないことを示す実証的な結果が報告される。
論文 参考訳(メタデータ) (2023-11-06T15:04:03Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Confidence-Ranked Reconstruction of Census Microdata from Published
Statistics [45.39928315344449]
プライベートデータセットに対する再構築攻撃は、データセットに関する公開アクセス情報を入力する。
我々の攻撃は、集約されたクエリ統計量$Q(D)Rmm$から全行を再構築できるだけでなく、その確率で確実に復元された行をランク付けできることを示す。
当社の攻撃は、公開ディストリビューションや、プライベートデータセットである$D$がサンプリングされた人口へのアクセスのみに基づく攻撃よりもはるかに優れています。
論文 参考訳(メタデータ) (2022-11-06T14:08:43Z) - No Free Lunch in "Privacy for Free: How does Dataset Condensation Help
Privacy" [75.98836424725437]
データプライバシを保護するために設計された新しい手法は、慎重に精査する必要がある。
プライバシ保護の失敗は検出し難いが,プライバシ保護法を実装したシステムが攻撃された場合,破滅的な結果につながる可能性がある。
論文 参考訳(メタデータ) (2022-09-29T17:50:23Z) - Releasing survey microdata with exact cluster locations and additional
privacy safeguards [77.34726150561087]
本稿では,プライバシ保護を付加した独自のマイクロデータの有用性を活用した,代替的なマイクロデータ配信戦略を提案する。
当社の戦略は, 再識別の試みにおいても, 任意の属性に対する再識別リスクを60~80%削減する。
論文 参考訳(メタデータ) (2022-05-24T19:37:11Z) - The Impact of the U.S. Census Disclosure Avoidance System on
Redistricting and Voting Rights Analysis [0.0]
米国国勢調査局は、2020年国勢調査の回答者のプライバシーを、情報開示回避システム(DAS)を通じて保護する計画だ。
保護されたデータは、目的を再限定するのに十分な品質ではないことが分かりました。
分析の結果,DASが保護するデータは,投票者の投票率や党派・人種構成に応じて,特定の領域に偏っていることがわかった。
論文 参考訳(メタデータ) (2021-05-29T03:32:36Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。