論文の概要: Evaluating the Impacts of Swapping on the US Decennial Census
- arxiv url: http://arxiv.org/abs/2502.01320v1
- Date: Mon, 03 Feb 2025 12:51:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 15:04:19.826994
- Title: Evaluating the Impacts of Swapping on the US Decennial Census
- Title(参考訳): スワッピングが米国十年国勢調査に与える影響評価
- Authors: Maria Ballesteros, Cynthia Dwork, Gary King, Conlan Olson, Manish Raghavan,
- Abstract要約: 我々は,Censusの出版物と裁判所文書に基づくパラメータ化スワップアルゴリズムを記述し,実装する。
差分プライバシを用いたテクニックをスワップして比較することで生じるシフトのタイプを直感的に評価する。
- 参考スコア(独自算出の注目度): 7.020785266789317
- License:
- Abstract: To meet its dual burdens of providing useful statistics and ensuring privacy of individual respondents, the US Census Bureau has for decades introduced some form of "noise" into published statistics, initially through a method known as "swapping" (1990--2010), and then, for the first time in 2020, via an algorithm ensuring a form of differential privacy. While the TopDown algorithm used in 2020 has been made public, no implementation of swapping has been released, in part to preserve the confidentiality of respondent data. The Bureau has not published (even a synthetic) "original" dataset and its swapped version, and it has kept secret many details of the swapping methodology deployed. It is therefore difficult to evaluate the effects of swapping, and to compare swapping to other privacy technologies. To address these difficulties we describe and implement a parameterized swapping algorithm based on Census publications and court documents, and informal interviews with Census employees. With this implementation, we characterize the impacts of swapping on a range of statistical quantities of interest. We provide intuition for the types of shifts induced by swapping and compare against techniques that use differential privacy. We find that even when swapping and differential privacy introduce errors of a similar magnitude, the direction in which statistics are biased need not be the same across the two techniques. More broadly, our implementation provides researchers with the tools to analyze and potentially correct for the impacts of disclosure avoidance systems on the quantities they study.
- Abstract(参考訳): 有用な統計を提供し、個々の回答者のプライバシーを確保するという2つの義務を満たすために、米国国勢調査局は、当初「スワッピング」と呼ばれる方法を通じて、公表された統計に「ノイズ」の形式を導入してきた。
1990年-2010年)、そして2020年に初めて、差分プライバシーの形式を保証するアルゴリズムを通した。
2020年に使用されるTopDownアルゴリズムが公開されたが、応答データの機密性を維持するためにスワッピングの実装はリリースされていない。
局は公表していません
(合成も)
データセットとそのスワップバージョンは、デプロイされたスワップメソッドに関する多くの詳細を秘密にしている。
したがって、スワップの効果を評価し、他のプライバシ技術と比較することは困難である。
これらの問題に対処するために、我々は、Censusの出版物と裁判所文書に基づくパラメータ化スワップアルゴリズムを記述し、実装し、Censusの従業員との非公式なインタビューを行う。
この実装では、統計量に対するスワップの影響を特徴付ける。
差分プライバシを用いたテクニックをスワップして比較することで生じるシフトのタイプを直感的に評価する。
我々は、スワッピングと差分プライバシーが同様の大きさのエラーを発生させたとしても、統計が偏っている方向は、この2つのテクニックで同じである必要はないことを発見した。
より広範に、我々の実装は、開示回避システムが研究量に与える影響を分析し、潜在的に正すためのツールを研究者に提供する。
関連論文リスト
- Differentially Private Data Release on Graphs: Inefficiencies and Unfairness [48.96399034594329]
本稿では,ネットワーク情報公開の文脈における偏見と不公平性に対する差別的プライバシの影響を特徴づける。
ネットワーク構造が全員に知られているネットワークリリースの問題を考えるが、エッジの重みをプライベートにリリースする必要がある。
我々の研究は、これらのネットワーク化された決定問題におけるプライバシーに起因する偏見と不公平性に関する理論的根拠と実証的な証拠を提供する。
論文 参考訳(メタデータ) (2024-08-08T08:37:37Z) - Synthetic Census Data Generation via Multidimensional Multiset Sum [7.900694093691988]
我々は、Censusの統計データのみから合成マイクロデータを生成するツールを提供する。
我々は,本手法が実際にうまく機能していることを示し,その性能を説明する理論的議論を行う。
論文 参考訳(メタデータ) (2024-04-15T19:06:37Z) - Benchmarking Private Population Data Release Mechanisms: Synthetic Data vs. TopDown [50.40020716418472]
本研究では、TopDownアルゴリズムとプライベート合成データ生成を比較し、クエリの複雑さによる精度への影響を判定する。
この結果から,TopDownアルゴリズムは,分散クエリに対して,評価したどの合成データ手法よりもはるかに優れたプライバシー-忠実トレードオフを実現することがわかった。
論文 参考訳(メタデータ) (2024-01-31T17:38:34Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - Evaluating Bias and Noise Induced by the U.S. Census Bureau's Privacy
Protection Methods [0.0]
アメリカ合衆国国勢調査局は、国勢調査統計の正確さと個々の情報の保護との間に難しいトレードオフに直面している。
我々は,2つの主要な開示回避システムによって誘導されるバイアスとノイズの独立評価を行う。
TopDownのポストプロセッシングはNMFノイズを劇的に低減し、スワップの精度に類似したデータを生成する。
論文 参考訳(メタデータ) (2023-06-13T03:30:19Z) - Enabling Trade-offs in Privacy and Utility in Genomic Data Beacons and
Summary Statistics [26.99521354120141]
要約データやBeaconの応答とプライバシを明示的にトレードオフするための最適化ベースのアプローチを導入します。
第一に、攻撃者はメンバーシップ推論のクレームを行うために確率比テストを適用する。
第2に、攻撃者は、個人間のスコアの分離に対するデータリリースの影響を考慮に入れたしきい値を使用する。
論文 参考訳(メタデータ) (2023-01-11T19:16:13Z) - Post-processing of Differentially Private Data: A Fairness Perspective [53.29035917495491]
本稿では,ポストプロセッシングが個人やグループに異なる影響を与えることを示す。
差分的にプライベートなデータセットのリリースと、ダウンストリームの決定にそのようなプライベートなデータセットを使用するという、2つの重要な設定を分析している。
それは、異なる公正度尺度の下で(ほぼ)最適である新しい後処理機構を提案する。
論文 参考訳(メタデータ) (2022-01-24T02:45:03Z) - Distribution-Invariant Differential Privacy [4.700764053354502]
本研究では,高い統計的精度と厳密な差分プライバシーを両立する分布不変民営化法(DIP)を提案する。
同じ厳密なプライバシー保護の下で、DIPは2つのシミュレーションと3つの実世界のベンチマークで優れた統計的精度を達成する。
論文 参考訳(メタデータ) (2021-11-08T22:26:50Z) - Decision Making with Differential Privacy under a Fairness Lens [65.16089054531395]
アメリカ国勢調査局は、多くの重要な意思決定プロセスの入力として使用される個人のグループに関するデータセットと統計を公表している。
プライバシと機密性要件に従うために、これらの機関は、しばしば、プライバシを保存するバージョンのデータを公開する必要がある。
本稿では,差分的プライベートデータセットのリリースについて検討し,公平性の観点から重要な資源配分タスクに与える影響を考察する。
論文 参考訳(メタデータ) (2021-05-16T21:04:19Z) - Differential Privacy of Hierarchical Census Data: An Optimization
Approach [53.29035917495491]
国勢調査局(Census Bureaus)は、個人に関する機密情報を明らかにすることなく、大人口に関する社会経済的データをまとめて公開することに興味を持っている。
最近の出来事では、これらの組織が直面しているプライバシー上の課題がいくつか特定されている。
本稿では,階層的な個人数を解放する新たな差分プライバシ機構を提案する。
論文 参考訳(メタデータ) (2020-06-28T18:19:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。