論文の概要: One country, multiple portraits: representativeness in GPS-based mobility data is source-specific and spatially dependent
- arxiv url: http://arxiv.org/abs/2606.23616v1
- Date: Mon, 22 Jun 2026 17:12:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 17:43:04.071024
- Title: One country, multiple portraits: representativeness in GPS-based mobility data is source-specific and spatially dependent
- Title(参考訳): 一つの国、複数のポートレート:GPSに基づく移動データの代表性はソース固有で空間依存である
- Authors: Carmen Cabrera, Francisco Rowe, Miguel González-Leonardo, Juan Ignacio Vilchis-García, Elisa Omodei, Maribel Hernández-Rosales,
- Abstract要約: 我々は、単一プラットフォームソース(Facebook)とマルチアプリアグリゲータ(Veraset)の人口推定を比較することで、メキシコの2,478自治体のカバレッジバイアスを定量化する。
その結果, 被曝バイアスの大きさと空間分布は, 情報源によって大きく異なることがわかった。
Facebookは、より大きく均等に分散したカバレッジを提供する一方、マルチアプリデータは、より大きく、より豊かで、よりデジタルに接続された場所にユーザーを集中させる。
被覆バイアスも空間的に構成されており、近隣の自治体も同様にオーバーカバーやアンダーカバーのレベルを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anonymised GPS-based mobile phone data are increasingly used to estimate population distribution and human mobility, supporting applications across disaster response, public health, urban planning and migration research. Yet whether these data fairly represent the populations they describe, particularly outside high-income countries, remains poorly understood. We quantify coverage bias for 2,478 municipalities in Mexico by comparing population estimates from a single-platform source (Facebook) and a multi-app aggregator (Veraset) against the 2020 Mexican Population Census. We find that the magnitude and spatial distribution of coverage bias differ substantially across sources. Facebook provides higher and more evenly distributed coverage, whereas the multi-app data concentrate users in larger, wealthier and more digitally connected places. Coverage bias is also spatially structured, with neighbouring municipalities showing similar levels of over- or under-coverage. Using explainable machine learning, we show that digital access and material resources are the dominant drivers of bias for the multi-app data, while demographic and population structure dominate for Facebook. Explicitly modelling spatial dependence improves the performance of statistical models for explaining bias and reveals that an appreciable share of spatial variation remains unexplained by observed covariates. These findings show that coverage bias is source-specific and spatially dependent, and provide a foundation for adjustments that improve the representativeness of mobile phone data in unequal, data-scarce settings.
- Abstract(参考訳): 匿名化されたGPSベースの携帯電話データは、人口分布と人間の移動性を推定し、災害対応、公衆衛生、都市計画、移住研究などにわたるアプリケーションをサポートするために、ますます利用されている。
しかし、これらのデータが、特に高所得国以外の国々の人口を正確に表しているかどうかはまだよく分かっていない。
メキシコの2,478自治体を対象に、単一プラットフォームソース(Facebook)とマルチアプリアグリゲータ(Veraset)の人口推定を、2020年のメキシコ人口国勢調査と比較することにより、カバーバイアスを定量化する。
その結果, 被曝バイアスの大きさと空間分布は, 情報源によって大きく異なることがわかった。
Facebookは、より大きく均等に分散したカバレッジを提供する一方、マルチアプリデータは、より大きく、より豊かで、よりデジタルに接続された場所にユーザーを集中させる。
被覆バイアスも空間的に構成されており、近隣の自治体も同様にオーバーカバーやアンダーカバーのレベルを示している。
説明可能な機械学習を用いて、デジタルアクセスと材料資源がマルチアプリデータのバイアスの主要な要因であるのに対し、人口統計と人口構造はFacebookに支配的であることを示す。
空間依存を明示的にモデル化することで、偏りを説明する統計モデルの性能が向上し、観測された共変量によって空間変動の有意な共有が説明できないことが明らかになった。
これらの結果から, 被曝バイアスはソース固有かつ空間依存的であり, 不平等なデータスカース環境での携帯電話データの表現性を改善するための基礎となることが示唆された。
関連論文リスト
- Person-Centric Annotations of LAION-400M: Auditing Bias and Its Transfer to Models [81.45743826739054]
大きな障壁は、LAION-400MのようなWebスケールデータセットにおける人口統計アノテーションの欠如である。
2億7600万以上のバウンディングボックスや、性別や人種/民族ラベルの認識、キャプションの自動生成など、完全なデータセットのための人中心アノテーションを作成します。
それらを用いて、黒人や中東と見なされる男性や個人と犯罪に関連する負のコンテンツとの不均等な結びつきなど、人口不均衡や有害な関連を明らかにする。
論文 参考訳(メタデータ) (2025-10-04T07:51:59Z) - A systematic machine learning approach to measure and assess biases in mobile phone population data [0.0]
我々は,集約された携帯電話アプリケーションデータのカバレッジバイアスを定量化するフレームワークを開発し,実装する。
携帯電話のデータは全国の大規模調査より常に高い人口範囲を達成していることを示す。
本研究は,携帯電話データにおけるバイアス評価基準の基礎を定めている。
論文 参考訳(メタデータ) (2025-08-29T21:25:30Z) - Data Bias in Human Mobility is a Universal Phenomenon but is Highly Location-specific [0.0]
我々は「データ生産」を研究し、個人が大きなデジタルデータセットで表現されているかどうかを定量化するとともに、そのデータ生成量の観点からどのように表現されているのかを定量化する。
我々は、米国の主要10都市を対象に、匿名化されたスマートフォンから収集したGPSモビリティデータを調査し、データポイントが富よりもユーザ間で不平等に分散できることを発見した。
我々は、国勢調査区域に居住する人口集団によるデータポイントの数を予測するモデルを構築し、富、民族、教育がデータ生産に与える影響を強く見出す。
論文 参考訳(メタデータ) (2025-07-31T20:19:50Z) - Differentially Private Data Release on Graphs: Inefficiencies and Unfairness [48.96399034594329]
本稿では,ネットワーク情報公開の文脈における偏見と不公平性に対する差別的プライバシの影響を特徴づける。
ネットワーク構造が全員に知られているネットワークリリースの問題を考えるが、エッジの重みをプライベートにリリースする必要がある。
我々の研究は、これらのネットワーク化された決定問題におけるプライバシーに起因する偏見と不公平性に関する理論的根拠と実証的な証拠を提供する。
論文 参考訳(メタデータ) (2024-08-08T08:37:37Z) - BiasBuster: a Neural Approach for Accurate Estimation of Population
Statistics using Biased Location Data [6.077198822448429]
統計的偏りは有用である場合もあるが,精度が向上しない場合が多い。
次に、人口統計と位置特性の相関を利用して、人口統計の正確な推定を行うニューラルネットワーク手法であるBiasBusterを提案する。
論文 参考訳(メタデータ) (2024-02-17T16:16:24Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - Biases in human mobility data impact epidemic modeling [0.0]
携帯電話の不正アクセスと不平等使用による2種類のバイアスを同定する。
我々は、高重量個体が過剰に表現されているすべての調査データセットにおいて、データ生成バイアスの証拠を見つける。
このスキューを緩和するために、データをデバイアスするフレームワークを提案し、代表性を高めるためにいかに簡単なテクニックが使えるかを示す。
論文 参考訳(メタデータ) (2021-12-23T13:20:54Z) - Leveraging Administrative Data for Bias Audits: Assessing Disparate
Coverage with Mobility Data for COVID-19 Policy [61.60099467888073]
管理データのリンクによって,バイアスに対するモビリティデータの監査が可能かを示す。
我々は、高齢者や非白人の有権者が移動データによって捕えられる可能性が低いことを示した。
このような移動データに基づく公衆衛生資源の配分は、高リスク高齢者や少数民族に不当に害を与える可能性があることを示す。
論文 参考訳(メタデータ) (2020-11-14T02:04:14Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z) - Facebook Ads as a Demographic Tool to Measure the Urban-Rural Divide [6.61600499731972]
われわれは、Facebookの広告プラットフォームの有用性について検討する。
我々は、Facebookが生み出す人口統計が、時間とともに不安定に陥り、人口の少ない自治体が不完全な範囲をカバーしていることを示す。
公的な国勢調査データを用いて、我々のアプローチを評価し、教育の達成と収入の観点から、既知の重要な都市と農村の分断を確認した。
論文 参考訳(メタデータ) (2020-02-26T17:19:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。