論文の概要: Common Misconceptions about Population Data
- arxiv url: http://arxiv.org/abs/2112.10912v1
- Date: Mon, 20 Dec 2021 23:54:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-22 15:34:49.945934
- Title: Common Misconceptions about Population Data
- Title(参考訳): 人口データに関する一般的な誤解
- Authors: Peter Christen and Rainer Schnell
- Abstract要約: 本稿は、このようなデータを扱う人なら誰でも知っておく必要があると信じている集団データに関するさまざまな誤解について論じる。
このようなデータベースの巨大なサイズは、しばしば関心の人口に対する有効な推測の保証として誤解される。
人口データを用いた場合,推測のための一連の推奨事項をまとめて結論付ける。
- 参考スコア(独自算出の注目度): 5.606904856295946
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Databases covering all individuals of a population are increasingly used for
research studies in domains ranging from public health to the social sciences.
There is also growing interest by governments and businesses to use population
data to support data-driven decision making. The massive size of such databases
is often mistaken as a guarantee for valid inferences on the population of
interest. However, population data have characteristics that make them
challenging to use, including various assumptions being made how such data were
collected and what types of processing have been applied to them. Furthermore,
the full potential of population data can often only be unlocked when such data
are linked to other databases, a process that adds fresh challenges. This
article discusses a diverse range of misconceptions about population data that
we believe anybody who works with such data needs to be aware of. Many of these
misconceptions are not well documented in scientific publications but only
discussed anecdotally among researchers and practitioners. We conclude with a
set of recommendations for inference when using population data.
- Abstract(参考訳): 人口の全ての個人をカバーするデータベースは、公衆衛生から社会科学まで幅広い分野の研究にますます利用されている。
政府や企業が、人口データを使ってデータ駆動意思決定を支援することへの関心が高まっている。
このようなデータベースの巨大なサイズは、しばしば関心の人口に対する有効な推測の保証として誤解される。
しかし、人口データには、これらのデータの収集方法や、どのような処理が適用されているかといった様々な仮定を含む、使用が困難な特徴がある。
さらに、人口データの潜在能力は、そのようなデータが他のデータベースにリンクされている場合にのみアンロックされることが多い。
本稿は、このようなデータを扱う人なら誰でも知っておく必要があると信じている集団データに関するさまざまな誤解について論じる。
これらの誤解の多くは科学的出版物では十分に文書化されていないが、研究者や実践者の間では逸話的にのみ議論されている。
人口データを用いて推測を行う際の推奨事項をまとめた。
関連論文リスト
- Differentially Private Data Release on Graphs: Inefficiencies and Unfairness [48.96399034594329]
本稿では,ネットワーク情報公開の文脈における偏見と不公平性に対する差別的プライバシの影響を特徴づける。
ネットワーク構造が全員に知られているネットワークリリースの問題を考えるが、エッジの重みをプライベートにリリースする必要がある。
我々の研究は、これらのネットワーク化された決定問題におけるプライバシーに起因する偏見と不公平性に関する理論的根拠と実証的な証拠を提供する。
論文 参考訳(メタデータ) (2024-08-08T08:37:37Z) - A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - BiasBuster: a Neural Approach for Accurate Estimation of Population
Statistics using Biased Location Data [6.077198822448429]
統計的偏りは有用である場合もあるが,精度が向上しない場合が多い。
次に、人口統計と位置特性の相関を利用して、人口統計の正確な推定を行うニューラルネットワーク手法であるBiasBusterを提案する。
論文 参考訳(メタデータ) (2024-02-17T16:16:24Z) - Mean Estimation with User-level Privacy under Data Heterogeneity [54.07947274508013]
異なるユーザーは、非常に多くの異なるデータポイントを持っているかもしれない。
すべてのユーザが同じディストリビューションからサンプルを採取していると仮定することはできない。
本研究では,データの分布と量の両方でユーザデータが異なる異質なユーザデータの単純なモデルを提案する。
論文 参考訳(メタデータ) (2023-07-28T23:02:39Z) - Releasing survey microdata with exact cluster locations and additional
privacy safeguards [77.34726150561087]
本稿では,プライバシ保護を付加した独自のマイクロデータの有用性を活用した,代替的なマイクロデータ配信戦略を提案する。
当社の戦略は, 再識別の試みにおいても, 任意の属性に対する再識別リスクを60~80%削減する。
論文 参考訳(メタデータ) (2022-05-24T19:37:11Z) - Pseudo-PFLOW: Development of nationwide synthetic open dataset for
people movement based on limited travel survey and open statistical data [4.243926243206826]
人フローデータは、都市や商業計画、災害管理など様々な分野で活用されている。
本研究では,一般統計と旅行調査データを組み合わせた擬似人流データを開発した。
論文 参考訳(メタデータ) (2022-05-02T05:13:53Z) - So2Sat POP -- A Curated Benchmark Data Set for Population Estimation
from Space on a Continental Scale [11.38584315242023]
欧州98都市における人口推定のための包括的データセットを提供する。
データセットは、デジタル標高モデル、地域気候帯、土地利用率、夜間光とマルチスペクトルセンチネル2画像の組み合わせ、およびOpen Street Mapイニシアチブのデータから構成される。
論文 参考訳(メタデータ) (2022-04-07T07:30:43Z) - Assessing the Quality of Gridded Population Data for Quantifying the
Population Living in Deprived Communities [0.0]
2014年、都市人口の65%がスラムに住んでいた。
スラムに関するデータのほとんどは国勢調査データから得られており、これは集計レベルでのみ利用可能であり、しばしばこれらの集落を除外している。
我々は1,703個のジオレファレンスポリゴンからなる地層データに対して,WorldPOPとLandScanの人口層の精度を評価する。
論文 参考訳(メタデータ) (2020-11-25T18:14:30Z) - Leveraging Administrative Data for Bias Audits: Assessing Disparate
Coverage with Mobility Data for COVID-19 Policy [61.60099467888073]
管理データのリンクによって,バイアスに対するモビリティデータの監査が可能かを示す。
我々は、高齢者や非白人の有権者が移動データによって捕えられる可能性が低いことを示した。
このような移動データに基づく公衆衛生資源の配分は、高リスク高齢者や少数民族に不当に害を与える可能性があることを示す。
論文 参考訳(メタデータ) (2020-11-14T02:04:14Z) - Bayesian Quantile Matching Estimation [4.56877715768796]
医学診断や政策アドバイスなどの研究と科学的理解は、しばしばデータアクセスに依存している。
本稿では,定量的情報からベイズ的学習法を提案する。
論文 参考訳(メタデータ) (2020-08-14T15:39:51Z) - Measuring Social Biases of Crowd Workers using Counterfactual Queries [84.10721065676913]
性別、人種などに基づく社会的バイアスは、主にバイアス付きトレーニングデータセットを介して、汚染された機械学習(ML)パイプラインに示されている。
クラウドソーシング(Crowdsourcing)は、ラベル付きトレーニングデータセットを収集するための一般的な費用効果尺度であり、群衆労働者の社会的偏見に免疫がない。
本研究では, 集団労働者ごとの社会的バイアスの程度を定量化するための, 対実的公正度に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-04-04T21:41:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。