論文の概要: Evaluating Bias and Noise Induced by the U.S. Census Bureau's Privacy
Protection Methods
- arxiv url: http://arxiv.org/abs/2306.07521v3
- Date: Sat, 10 Feb 2024 23:31:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 00:40:20.965879
- Title: Evaluating Bias and Noise Induced by the U.S. Census Bureau's Privacy
Protection Methods
- Title(参考訳): アメリカ合衆国国勢調査局のプライバシー保護方法によるバイアスと騒音の評価
- Authors: Christopher T. Kenny, Cory McCartan, Shiro Kuriwaki, Tyler Simko,
Kosuke Imai
- Abstract要約: アメリカ合衆国国勢調査局は、国勢調査統計の正確さと個々の情報の保護との間に難しいトレードオフに直面している。
我々は,2つの主要な開示回避システムによって誘導されるバイアスとノイズの独立評価を行う。
TopDownのポストプロセッシングはNMFノイズを劇的に低減し、スワップの精度に類似したデータを生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The United States Census Bureau faces a difficult trade-off between the
accuracy of Census statistics and the protection of individual information. We
conduct the first independent evaluation of bias and noise induced by the
Bureau's two main disclosure avoidance systems: the TopDown algorithm employed
for the 2020 Census and the swapping algorithm implemented for the three
previous Censuses. Our evaluation leverages the Noisy Measure File (NMF) as
well as two independent runs of the TopDown algorithm applied to the 2010
decennial Census. We find that the NMF contains too much noise to be directly
useful, especially for Hispanic and multiracial populations. TopDown's
post-processing dramatically reduces the NMF noise and produces data whose
accuracy is similar to that of swapping. While the estimated errors for both
TopDown and swapping algorithms are generally no greater than other sources of
Census error, they can be relatively substantial for geographies with small
total populations.
- Abstract(参考訳): アメリカ合衆国国勢調査局は、国勢調査統計の正確さと個々の情報の保護との間に難しいトレードオフに直面している。
本研究では,2020年国勢調査に採用したTopDownアルゴリズムと,以前の3つの国勢調査に実装されたスワッピングアルゴリズムの2つの主要な開示回避システムによるバイアスとノイズの独立性評価を行う。
本評価は,2010年度国勢調査に適用したtopdownアルゴリズムの2つの独立実行に加えて,ノイズ測定ファイル(nmf)を活用する。
NMFには、特にヒスパニック系および多人種集団にとって、直接的に役立つノイズが多すぎることが判明した。
TopDownのポストプロセッシングはNMFノイズを劇的に低減し、スワップの精度に類似したデータを生成する。
TopDownアルゴリズムとスワップアルゴリズムの両方の推定誤差は、通常、国勢調査誤差の他の源ほど大きくはないが、人口が少ない地理学では比較的重要なものである。
関連論文リスト
- Making Differential Privacy Work for Census Data Users [0.0]
アメリカ国勢調査局は、研究者や政策立案者によって多用されているアメリカ人に関する詳細な人口統計データを収集し、公表している。
このプライバシ保護システムの重要な出力はノイズ計測ファイル(NMF)であり、これは集計された統計にランダムノイズを加えることで生成される。
我々は、NMFを使用可能なフォーマットに変換するために使用するプロセスを説明し、NMFの今後のバージョンをどうリリースするかを局に推奨する。
論文 参考訳(メタデータ) (2023-05-12T02:48:11Z) - Addressing Census data problems in race imputation via fully Bayesian
Improved Surname Geocoding and name supplements [0.0]
本稿では,全ベイズ改良サーネームジオコーディング(fBISG)手法を提案する。
我々は、自己申告された人種が利用可能である6つの南部州の有権者ファイルから得た、最終、第一、中の名前に関する追加データで、国勢調査の姓データを補足する。
実証実験の結果,fBISGの方法論と名称サプリメントにより,人種集団,特にアジア諸国における人種的インパクションの精度が著しく向上することが示唆された。
論文 参考訳(メタデータ) (2022-05-12T14:41:45Z) - Census TopDown: The Impacts of Differential Privacy on Redistricting [0.3746889836344765]
我々は、Censusデータの再分割におけるいくつかの重要な応用について考察する。
われわれはTopDownが許容可能な人口収支を持つ地区を生産する能力を脅かさないという確実な証拠を見つける。
論文 参考訳(メタデータ) (2022-03-09T23:28:53Z) - Post-processing of Differentially Private Data: A Fairness Perspective [53.29035917495491]
本稿では,ポストプロセッシングが個人やグループに異なる影響を与えることを示す。
差分的にプライベートなデータセットのリリースと、ダウンストリームの決定にそのようなプライベートなデータセットを使用するという、2つの重要な設定を分析している。
それは、異なる公正度尺度の下で(ほぼ)最適である新しい後処理機構を提案する。
論文 参考訳(メタデータ) (2022-01-24T02:45:03Z) - Smoothed Differential Privacy [55.415581832037084]
微分プライバシー(DP)は、最悪のケース分析に基づいて広く受け入れられ、広く適用されているプライバシーの概念である。
本稿では, 祝賀されたスムーズな解析の背景にある最悪の平均ケースのアイデアに倣って, DPの自然な拡張を提案する。
サンプリング手順による離散的なメカニズムはDPが予測するよりもプライベートであるのに対して,サンプリング手順による連続的なメカニズムはスムーズなDP下では依然としてプライベートではないことが証明された。
論文 参考訳(メタデータ) (2021-07-04T06:55:45Z) - The Impact of the U.S. Census Disclosure Avoidance System on
Redistricting and Voting Rights Analysis [0.0]
米国国勢調査局は、2020年国勢調査の回答者のプライバシーを、情報開示回避システム(DAS)を通じて保護する計画だ。
保護されたデータは、目的を再限定するのに十分な品質ではないことが分かりました。
分析の結果,DASが保護するデータは,投票者の投票率や党派・人種構成に応じて,特定の領域に偏っていることがわかった。
論文 参考訳(メタデータ) (2021-05-29T03:32:36Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Robust and Differentially Private Mean Estimation [40.323756738056616]
異なるプライバシーは、米国国勢調査から商用デバイスで収集されたデータまで、さまざまなアプリケーションで標準要件として浮上しています。
このようなデータベースの数は、複数のソースからのデータからなり、それらすべてが信頼できるわけではない。
これにより、既存のプライベート分析は、腐敗したデータを注入する敵による攻撃に弱い。
論文 参考訳(メタデータ) (2021-02-18T05:02:49Z) - Graph-Homomorphic Perturbations for Private Decentralized Learning [64.26238893241322]
ローカルな見積もりの交換は、プライベートデータに基づくデータの推測を可能にする。
すべてのエージェントで独立して選択された摂動により、パフォーマンスが著しく低下する。
本稿では,特定のヌル空間条件に従って摂動を構成する代替スキームを提案する。
論文 参考訳(メタデータ) (2020-10-23T10:35:35Z) - Differential Privacy of Hierarchical Census Data: An Optimization
Approach [53.29035917495491]
国勢調査局(Census Bureaus)は、個人に関する機密情報を明らかにすることなく、大人口に関する社会経済的データをまとめて公開することに興味を持っている。
最近の出来事では、これらの組織が直面しているプライバシー上の課題がいくつか特定されている。
本稿では,階層的な個人数を解放する新たな差分プライバシ機構を提案する。
論文 参考訳(メタデータ) (2020-06-28T18:19:55Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。