論文の概要: SafeTab-H: Disclosure Avoidance for the 2020 Census Detailed Demographic and Housing Characteristics File B (Detailed DHC-B)
- arxiv url: http://arxiv.org/abs/2505.03072v1
- Date: Fri, 02 May 2025 13:15:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-07 18:50:11.147479
- Title: SafeTab-H: Disclosure Avoidance for the 2020 Census Detailed Demographic and Housing Characteristics File B (Detailed DHC-B)
- Title(参考訳): SafeTab-H:2020年国勢調査詳細なデモグラフィックと住宅特性ファイルBの開示回避(詳細DHC-B)
- Authors: William Sexton, Skye Berghel, Bayard Carlson, Sam Haney, Luke Hartman, Michael Hay, Ashwin Machanavajjhala, Gerome Miklau, Amritha Pai, Simran Rajpal, David Pujol, Ruchit Shrestha, Daniel Simmons-Marengo,
- Abstract要約: 本稿では,米国国勢調査局のDetailed Demographic and Housing Characteristics File Bのリリースに適用される開示回避アルゴリズムであるSafeTab-Hについて述べる。
このアルゴリズムは、ゼロ集中差分プライバシーと呼ばれる、よく研究されている差分プライバシーの変種を満たすことを示す。
- 参考スコア(独自算出の注目度): 7.7544849165583525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This article describes SafeTab-H, a disclosure avoidance algorithm applied to the release of the U.S. Census Bureau's Detailed Demographic and Housing Characteristics File B (Detailed DHC-B) as part of the 2020 Census. The tabulations contain household statistics about household type and tenure iterated by the householder's detailed race, ethnicity, or American Indian and Alaska Native tribe and village at varying levels of geography. We describe the algorithmic strategy which is based on adding noise from a discrete Gaussian distribution and show that the algorithm satisfies a well-studied variant of differential privacy, called zero-concentrated differential privacy. We discuss how the implementation of the SafeTab-H codebase relies on the Tumult Analytics privacy library. We also describe the theoretical expected error properties of the algorithm and explore various aspects of its parameter tuning.
- Abstract(参考訳): この記事では、2020年国勢調査の一部として、米国国勢調査局の詳細なデモグラフィックおよび住宅特性ファイルB(詳細DHC-B)のリリースに適用される開示回避アルゴリズムであるSafeTab-Hについて説明する。
この表には、世帯の詳細な人種、民族、またはインディアンやアラスカの部族や村落が地理的に異なるレベルで反復した世帯タイプと任期に関する家計統計が含まれている。
本稿では,離散ガウス分布から雑音を加えるアルゴリズム戦略について述べるとともに,このアルゴリズムがゼロ集中差分プライバシーと呼ばれる,よく研究されている差分プライバシーの変種を満たすことを示す。
SafeTab-Hコードベースの実装は、Tumult Analyticsのプライバシーライブラリに依存するかについて議論する。
また,アルゴリズムの予測誤差特性を理論的に記述し,パラメータチューニングの様々な側面について考察する。
関連論文リスト
- PHSafe: Disclosure Avoidance for the 2020 Census Supplemental Demographic and Housing Characteristics File (S-DHC) [7.7544849165583525]
本稿では、離散ガウス分布から引き出された雑音を興味のある統計に付加するPHSafeアルゴリズムについて述べる。
このアルゴリズムは、ゼロ集中差分プライバシーと呼ばれる、よく研究されている差分プライバシーの変種を満たすことを証明している。
論文 参考訳(メタデータ) (2025-05-02T13:20:32Z) - SafeTab-P: Disclosure Avoidance for the 2020 Census Detailed Demographic and Housing Characteristics File A (Detailed DHC-A) [7.787555954397617]
この記事では、米国国勢調査局が2020年国勢調査の詳細なデモグラフィック・ハウジング特性ファイルA(DHC-A)を保護するために使用した開示回避アルゴリズムについて述べる。
SafeTab-Pアルゴリズムは、離散ガウス分布から興味のある統計に引き出された雑音を付加することに基づいている。
我々は、このアルゴリズムがゼロ集中微分プライバシー(zCDP)と呼ばれる、よく研究された微分プライバシーの変種を満たすことを証明した。
論文 参考訳(メタデータ) (2025-05-02T13:08:28Z) - The 2020 United States Decennial Census Is More Private Than You (Might) Think [25.32778927275117]
2020年の米国国勢調査は、その名目上の保証が示すよりもはるかに強力なプライバシー保護を提供している。
ノイズのばらつきを15.08%$から24.82%$に減らし、地理的レベルごとにほぼ同じレベルのプライバシー保護を維持できることを示した。
論文 参考訳(メタデータ) (2024-10-11T23:06:15Z) - Full-Information Estimation For Hierarchical Data [0.43512163406552007]
アメリカ合衆国国勢調査局の2020年開示回避システム(DAS)はノイズ測定に基づく出力をベースとしている。
これらのノイズの測定は階層的な地理的単位、例えばアメリカ合衆国全体、州、郡、国勢調査区域、国勢調査ブロックで観測される。
本稿では、これらの雑音測定における階層構造を利用して、任意の集計のための信頼区間を計算する手法について述べる。
論文 参考訳(メタデータ) (2024-04-19T20:18:16Z) - Differentially Private Stochastic Gradient Descent with Low-Noise [49.981789906200035]
現代の機械学習アルゴリズムは、データからきめ細かい情報を抽出して正確な予測を提供することを目的としており、プライバシー保護の目標と矛盾することが多い。
本稿では、プライバシを保ちながら優れたパフォーマンスを確保するために、プライバシを保存する機械学習アルゴリズムを開発することの実践的および理論的重要性について論じる。
論文 参考訳(メタデータ) (2022-09-09T08:54:13Z) - Individual Privacy Accounting for Differentially Private Stochastic Gradient Descent [69.14164921515949]
DP-SGDで訓練されたモデルをリリースする際の個々の事例に対するプライバシー保証を特徴付ける。
ほとんどの例では、最悪のケースよりも強力なプライバシー保証を享受しています。
これは、モデルユーティリティの観点からは守られないグループが同時に、より弱いプライバシー保証を経験することを意味する。
論文 参考訳(メタデータ) (2022-06-06T13:49:37Z) - The Impact of the U.S. Census Disclosure Avoidance System on
Redistricting and Voting Rights Analysis [0.0]
米国国勢調査局は、2020年国勢調査の回答者のプライバシーを、情報開示回避システム(DAS)を通じて保護する計画だ。
保護されたデータは、目的を再限定するのに十分な品質ではないことが分かりました。
分析の結果,DASが保護するデータは,投票者の投票率や党派・人種構成に応じて,特定の領域に偏っていることがわかった。
論文 参考訳(メタデータ) (2021-05-29T03:32:36Z) - Do Not Let Privacy Overbill Utility: Gradient Embedding Perturbation for
Private Learning [74.73901662374921]
差分プライベートモデルは、モデルが多数のトレーニング可能なパラメータを含む場合、ユーティリティを劇的に劣化させる。
偏微分プライベート深層モデルの精度向上のためのアルゴリズムemphGradient Embedding Perturbation (GEP)を提案する。
論文 参考訳(メタデータ) (2021-02-25T04:29:58Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z) - A One-Pass Private Sketch for Most Machine Learning Tasks [48.17461258268463]
差別化プライバシ(DP)は、正式な証明可能な保証を通じて、プライバシとユーティリティのトレードオフを説明する魅力的なプライバシ定義である。
本稿では,回帰,分類,密度推定など,多数の機械学習タスクをサポートするプライベートスケッチを提案する。
このスケッチは,局所性に敏感なハッシュをインデックス化して,効率的なワンパスアルゴリズムで構築したランダムな一致テーブルで構成されている。
論文 参考訳(メタデータ) (2020-06-16T17:47:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。