論文の概要: SafeTab-P: Disclosure Avoidance for the 2020 Census Detailed Demographic and Housing Characteristics File A (Detailed DHC-A)
- arxiv url: http://arxiv.org/abs/2505.01472v1
- Date: Fri, 02 May 2025 13:08:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.137404
- Title: SafeTab-P: Disclosure Avoidance for the 2020 Census Detailed Demographic and Housing Characteristics File A (Detailed DHC-A)
- Title(参考訳): SafeTab-P:2020年国勢調査の詳細なデモグラフィックと住宅特性ファイルAの開示回避(詳細DHC-A)
- Authors: Sam Haney, Skye Berghel, Bayard Carlson, Ryan Cumings-Menon, Luke Hartman, Michael Hay, Ashwin Machanavajjhala, Gerome Miklau, Amritha Pai, Simran Rajpal, David Pujol, William Sexton, Ruchit Shrestha, Daniel Simmons-Marengo,
- Abstract要約: この記事では、米国国勢調査局が2020年国勢調査の詳細なデモグラフィック・ハウジング特性ファイルA(DHC-A)を保護するために使用した開示回避アルゴリズムについて述べる。
SafeTab-Pアルゴリズムは、離散ガウス分布から興味のある統計に引き出された雑音を付加することに基づいている。
我々は、このアルゴリズムがゼロ集中微分プライバシー(zCDP)と呼ばれる、よく研究された微分プライバシーの変種を満たすことを証明した。
- 参考スコア(独自算出の注目度): 7.787555954397617
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This article describes the disclosure avoidance algorithm that the U.S. Census Bureau used to protect the Detailed Demographic and Housing Characteristics File A (Detailed DHC-A) of the 2020 Census. The tabulations contain statistics (counts) of demographic characteristics of the entire population of the United States, crossed with detailed races and ethnicities at varying levels of geography. The article describes the SafeTab-P algorithm, which is based on adding noise drawn to statistics of interest from a discrete Gaussian distribution. A key innovation in SafeTab-P is the ability to adaptively choose how many statistics and at what granularity to release them, depending on the size of a population group. We prove that the algorithm satisfies a well-studied variant of differential privacy, called zero-concentrated differential privacy (zCDP). We then describe how the algorithm was implemented on Tumult Analytics and briefly outline the parameterization and tuning of the algorithm.
- Abstract(参考訳): 本稿では、米国国勢調査局が2020年国勢調査の詳細なデモグラフィック・ハウジング特性ファイルA(詳細DHC-A)を保護するために使用した開示回避アルゴリズムについて述べる。
この表には、アメリカ合衆国全人口の人口統計(数)が含まれており、詳細な人種や民族が地理的に異なるレベルで交わっている。
本稿では、離散ガウス分布から興味のある統計にノイズを付加するSafeTab-Pアルゴリズムについて述べる。
SafeTab-Pの重要なイノベーションは、人口集団の大きさに応じて、どれだけの統計と、どの粒度を解放するかを適応的に選択できることだ。
このアルゴリズムは、ゼロ集中微分プライバシー(zCDP)と呼ばれる、よく研究された微分プライバシーの変種を満たすことを証明している。
次に、アルゴリズムがTumult Analytics上でどのように実装されたかを説明し、アルゴリズムのパラメータ化とチューニングについて概説する。
関連論文リスト
- PHSafe: Disclosure Avoidance for the 2020 Census Supplemental Demographic and Housing Characteristics File (S-DHC) [7.7544849165583525]
本稿では、離散ガウス分布から引き出された雑音を興味のある統計に付加するPHSafeアルゴリズムについて述べる。
このアルゴリズムは、ゼロ集中差分プライバシーと呼ばれる、よく研究されている差分プライバシーの変種を満たすことを証明している。
論文 参考訳(メタデータ) (2025-05-02T13:20:32Z) - Full-Information Estimation For Hierarchical Data [0.43512163406552007]
アメリカ合衆国国勢調査局の2020年開示回避システム(DAS)はノイズ測定に基づく出力をベースとしている。
これらのノイズの測定は階層的な地理的単位、例えばアメリカ合衆国全体、州、郡、国勢調査区域、国勢調査ブロックで観測される。
本稿では、これらの雑音測定における階層構造を利用して、任意の集計のための信頼区間を計算する手法について述べる。
論文 参考訳(メタデータ) (2024-04-19T20:18:16Z) - Evaluating Bias and Noise Induced by the U.S. Census Bureau's Privacy
Protection Methods [0.0]
アメリカ合衆国国勢調査局は、国勢調査統計の正確さと個々の情報の保護との間に難しいトレードオフに直面している。
我々は,2つの主要な開示回避システムによって誘導されるバイアスとノイズの独立評価を行う。
TopDownのポストプロセッシングはNMFノイズを劇的に低減し、スワップの精度に類似したデータを生成する。
論文 参考訳(メタデータ) (2023-06-13T03:30:19Z) - Retiring $\Delta$DP: New Distribution-Level Metrics for Demographic
Parity [47.78843764957511]
デルタDP$のフェアネス指標は、人口格差の違反を正確に測定することはできない。
確率密度関数曲線(ABPC)と累積密度関数曲線(ABCC)の2つの新しいフェアネス指標を提案する。
提案手法では, ABCC/ABPCがゼロ値であること, ABCC/ABPCがゼロ値であること, ABCC/ABPCが階層パリティを保証し, 分類しきい値の調整を行う。
論文 参考訳(メタデータ) (2023-01-31T06:43:55Z) - The Impact of the U.S. Census Disclosure Avoidance System on
Redistricting and Voting Rights Analysis [0.0]
米国国勢調査局は、2020年国勢調査の回答者のプライバシーを、情報開示回避システム(DAS)を通じて保護する計画だ。
保護されたデータは、目的を再限定するのに十分な品質ではないことが分かりました。
分析の結果,DASが保護するデータは,投票者の投票率や党派・人種構成に応じて,特定の領域に偏っていることがわかった。
論文 参考訳(メタデータ) (2021-05-29T03:32:36Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Differential Privacy of Hierarchical Census Data: An Optimization
Approach [53.29035917495491]
国勢調査局(Census Bureaus)は、個人に関する機密情報を明らかにすることなく、大人口に関する社会経済的データをまとめて公開することに興味を持っている。
最近の出来事では、これらの組織が直面しているプライバシー上の課題がいくつか特定されている。
本稿では,階層的な個人数を解放する新たな差分プライバシ機構を提案する。
論文 参考訳(メタデータ) (2020-06-28T18:19:55Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z) - A One-Pass Private Sketch for Most Machine Learning Tasks [48.17461258268463]
差別化プライバシ(DP)は、正式な証明可能な保証を通じて、プライバシとユーティリティのトレードオフを説明する魅力的なプライバシ定義である。
本稿では,回帰,分類,密度推定など,多数の機械学習タスクをサポートするプライベートスケッチを提案する。
このスケッチは,局所性に敏感なハッシュをインデックス化して,効率的なワンパスアルゴリズムで構築したランダムな一致テーブルで構成されている。
論文 参考訳(メタデータ) (2020-06-16T17:47:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。