論文の概要: Least Squares Estimation For Hierarchical Data
- arxiv url: http://arxiv.org/abs/2404.13164v2
- Date: Wed, 04 Jun 2025 12:13:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:13.79089
- Title: Least Squares Estimation For Hierarchical Data
- Title(参考訳): 階層データの最小二乗推定
- Authors: Ryan Cumings-Menon, Pavel Zhuravlev,
- Abstract要約: アメリカ合衆国国勢調査局の2020年開示回避システム(DAS)はノイズ測定に基づく出力をベースとしている。
本稿では,非常に高次元の最小二乗推定値を計算するために,入力データの階層構造を利用するアルゴリズムについて述べる。
- 参考スコア(独自算出の注目度): 0.7366405857677227
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The U.S. Census Bureau's 2020 Disclosure Avoidance System (DAS) bases its output on noisy measurements, which are population tabulations added to realizations of mean-zero random variables. These noisy measurements are observed for a set of hierarchical geographic units, e.g., the U.S. as a whole, states, counties, census tracts, and census blocks. The Census Bureau released the noisy measurements generated in the DAS executions for the two primary 2020 Census data products, in part to allow data users to assess uncertainty in 2020 Census tabulations introduced by disclosure avoidance. This paper describes an algorithm that can leverage a hierarchical structure of the input data in order to compute very high dimensional least squares estimates in a computationally efficient manner. Afterward, we show that this algorithm's output is equal to the generalized least squares estimator, describe how to find the variance of linear functions of this estimator, and provide a numerical experiment in which we compute confidence intervals of 2010 Census tabulations based on this estimator. We also describe an accompanying Census Bureau experimental data product that applies this estimator to the publicly available noisy measurements to provide data users with the inputs required to estimate confidence intervals for all tabulations that were included in one of the two main 2020 Census data products, i.e., the 2020 Redistricting Data Product, in the US, state, county, and census tract geographic levels.
- Abstract(参考訳): アメリカ合衆国国勢調査局の2020年開示回避システム(DAS)は、平均ゼロ確率変数の実現に付加される人口の集計であるノイズ測定に基づいて、その出力をベースとしている。
これらのノイズ測定は、階層的な地理的単位、例えばアメリカ合衆国全体、州、郡、国勢調査区域、国勢調査ブロックで観測される。
国勢調査局は、データ利用者が開示回避によって導入された2020年の国勢調査集計の不確実性を評価するために、2つの主要な2020年国勢調査データ製品のDAS実行時に発生するノイズ測定を公開した。
本稿では,非常に高次元の最小二乗推定値を計算するために,入力データの階層構造を利用するアルゴリズムについて述べる。
その後、このアルゴリズムの出力は、一般化された最小二乗推定器に等しいことを示し、この推定器の線形関数のばらつきを見つける方法を記述し、この推定器に基づいて2010年国勢調査集計の信頼区間を計算する数値実験を行う。
また,2020年国勢調査データ製品である2020年国勢調査データ製品(米国,州,郡,国勢調査地域)の2つの主要データ製品のうちの1つに含まれるすべての集計項目の信頼区間を推定するために必要なインプットを,データ利用者に提供するために,この推定値を適用した国勢調査局実験データ製品についても述べる。
関連論文リスト
- Scalable Private Partition Selection via Adaptive Weighting [66.09199304818928]
プライベート・セット・ユニオンでは、ユーザーは非有界宇宙からのアイテムのサブセットを保持する。
目標は、ユーザレベルの差分プライバシーを維持しながら、ユーザセットの統一から可能な限り多くのアイテムを出力することである。
そこで本研究では,プライバシに必要なしきい値よりもはるかに重い項目からより少ない項目へ適応的に重みを還元するアルゴリズムであるMaximumDegree (MAD)を提案する。
論文 参考訳(メタデータ) (2025-02-13T01:27:11Z) - Best Linear Unbiased Estimate from Privatized Histograms [6.17477133700348]
差分プライバシ(DP)メカニズムでは、"冗長"出力を解放することは有益である。
最小分散処理は線形射影であることを示す。
最適線形不偏推定(SEA BLUE)のためのスケーラブルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-06T16:27:34Z) - Noisy Measurements Are Important, the Design of Census Products Is Much More Important [1.52292571922932]
McCartan et al. (2023) は「国勢調査データユーザーのための差分プライバシー業務」を要求している。
このコメントは、2020年の国勢調査ノイズ計測ファイル(NMFs)が、この嘆願の最良の焦点ではない理由を説明している。
論文 参考訳(メタデータ) (2023-12-20T15:43:04Z) - Robust Statistical Comparison of Random Variables with Locally Varying
Scale of Measurement [0.562479170374811]
異なる次元の多次元構造のような局所的に異なる測定スケールを持つ空間は、統計学や機械学習において非常に一般的である。
我々は、そのような非標準空間に写像される確率変数の期待値(集合)に基づく順序を考えることで、この問題に対処する。
この順序は、極端ケースとして支配性や期待順序を含む。
論文 参考訳(メタデータ) (2023-06-22T11:02:18Z) - Concrete Score Matching: Generalized Score Matching for Discrete Data [109.12439278055213]
コンクレトスコア(Concrete score)とは、個別の設定のためのスコア(ステイン)の一般化である。
コンクレトスコアマッチング(Concrete Score Matching)は、サンプルからこのようなスコアを学習するフレームワークである。
論文 参考訳(メタデータ) (2022-11-02T00:41:37Z) - Compact Redistricting Plans Have Many Spanning Trees [39.779544988993294]
政治的再分権マップの設計と分析において、国勢調査ブロックのグラフのすべての分割の空間から同じ人口の連結部分グラフにサンプリングできることがしばしば有用である。
本稿では,境界分割領域の総長さと,そのような写像がサンプリングされる確率との間には,逆指数関係が成立する。
論文 参考訳(メタデータ) (2021-09-27T23:36:01Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Fewer is More: A Deep Graph Metric Learning Perspective Using Fewer
Proxies [65.92826041406802]
本稿では,グラフ分類の観点から,プロキシベースのディープグラフメトリックラーニング手法を提案する。
複数のグローバルプロキシを利用して、各クラスの元のデータポイントを総括的に近似する。
本研究では, 近接関係を接地トラス・ラベルに従って調整する, 新たな逆ラベル伝搬アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-10-26T14:52:42Z) - Distribution Matching for Crowd Counting [51.90971145453012]
アノテーションにガウスを付与することは一般化性能を損なうことを示す。
我々は,群集CoUNTing (DM-Count) における分布マッチングの利用を提案する。
平均絶対誤差(Mean Absolute Error)の観点では、DM-Countは従来の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-28T04:57:23Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z) - NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization [101.13851473792334]
我々は,5,109枚の画像からなる大規模集束群集NWPU-Crowdを構築し,合計2,133,375個の点と箱を付加したアノテートヘッドを構築した。
他の実世界のデータセットと比較すると、様々な照明シーンを含み、最大密度範囲 (020,033) を持つ。
本稿では,データ特性について述べるとともに,主要なSOTA(State-of-the-art)手法の性能を評価し,新たなデータに生じる問題を分析する。
論文 参考訳(メタデータ) (2020-01-10T09:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。