論文の概要: A systematic machine learning approach to measure and assess biases in mobile phone population data
- arxiv url: http://arxiv.org/abs/2509.02603v1
- Date: Fri, 29 Aug 2025 21:25:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.246919
- Title: A systematic machine learning approach to measure and assess biases in mobile phone population data
- Title(参考訳): 携帯電話人口データにおけるバイアスの測定と評価のための体系的機械学習手法
- Authors: Carmen Cabrera, Francisco Rowe,
- Abstract要約: 我々は,集約された携帯電話アプリケーションデータのカバレッジバイアスを定量化するフレームワークを開発し,実装する。
携帯電話のデータは全国の大規模調査より常に高い人口範囲を達成していることを示す。
本研究は,携帯電話データにおけるバイアス評価基準の基礎を定めている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Traditional sources of population data, such as censuses and surveys, are costly, infrequent, and often unavailable in crisis-affected regions. Mobile phone application data offer near real-time, high-resolution insights into population distribution, but their utility is undermined by unequal access to and use of digital technologies, creating biases that threaten representativeness. Despite growing recognition of these issues, there is still no standard framework to measure and explain such biases, limiting the reliability of digital traces for research and policy. We develop and implement a systematic, replicable framework to quantify coverage bias in aggregated mobile phone application data without requiring individual-level demographic attributes. The approach combines a transparent indicator of population coverage with explainable machine learning to identify contextual drivers of spatial bias. Using four datasets for the United Kingdom benchmarked against the 2021 census, we show that mobile phone data consistently achieve higher population coverage than major national surveys, but substantial biases persist across data sources and subnational areas. Coverage bias is strongly associated with demographic, socioeconomic, and geographic features, often in complex nonlinear ways. Contrary to common assumptions, multi-application datasets do not necessarily reduce bias compared to single-app sources. Our findings establish a foundation for bias assessment standards in mobile phone data, offering practical tools for researchers, statistical agencies, and policymakers to harness these datasets responsibly and equitably.
- Abstract(参考訳): 国勢調査や調査のような伝統的な人口データ源は費用がかかり、頻度が低く、危機の影響を受けやすい地域では利用できないことが多い。
携帯電話のアプリケーションデータは、人口分布に関するほぼリアルタイムで高解像度な洞察を提供するが、デジタル技術へのアクセスと利用が不平等で、代表性を脅かすバイアスが生じることにより、その実用性は損なわれている。
これらの問題に対する認識が高まりつつあるにもかかわらず、そのようなバイアスを計測し、説明するための標準フレームワークはいまだ存在しておらず、研究と政策のためのデジタルトレースの信頼性が制限されている。
我々は,個別の階層属性を必要とせずに,集約された携帯電話アプリケーションデータのカバレッジバイアスを定量化するための,体系的かつレプリケートなフレームワークを開発し,実装する。
このアプローチは、人口被覆の透明な指標と説明可能な機械学習を組み合わせて、空間バイアスの文脈的要因を特定する。
2021年の国勢調査に比較して、イギリスにおける4つのデータセットを用いて、携帯電話のデータは、主要な全国調査よりも一貫して高い人口カバレッジを達成しているが、データソースとサブナショナルエリア間でかなりのバイアスが持続していることを示す。
被覆バイアスは人口統計学、社会経済学、地理的特徴と強く結びついており、しばしば複雑な非線形に関係している。
一般的な仮定とは対照的に、マルチアプリケーションデータセットはシングルアプリソースに比べて必ずしもバイアスを減らさない。
本研究は,携帯電話データにおけるバイアス評価基準の基礎を確立し,研究者,統計機関,政策立案者に対して,これらのデータセットを自律的かつ公平に活用するための実用的なツールを提供する。
関連論文リスト
- Data Bias in Human Mobility is a Universal Phenomenon but is Highly Location-specific [0.0]
我々は「データ生産」を研究し、個人が大きなデジタルデータセットで表現されているかどうかを定量化するとともに、そのデータ生成量の観点からどのように表現されているのかを定量化する。
我々は、米国の主要10都市を対象に、匿名化されたスマートフォンから収集したGPSモビリティデータを調査し、データポイントが富よりもユーザ間で不平等に分散できることを発見した。
我々は、国勢調査区域に居住する人口集団によるデータポイントの数を予測するモデルを構築し、富、民族、教育がデータ生産に与える影響を強く見出す。
論文 参考訳(メタデータ) (2025-07-31T20:19:50Z) - Leveraging Prototypical Representations for Mitigating Social Bias without Demographic Information [50.29934517930506]
DAFairは、言語モデルにおける社会的バイアスに対処する新しいアプローチである。
偏見を緩和するために、原型的人口統計テキストを活用し、微調整プロセス中に正規化用語を取り入れる。
論文 参考訳(メタデータ) (2024-03-14T15:58:36Z) - BiasBuster: a Neural Approach for Accurate Estimation of Population
Statistics using Biased Location Data [6.077198822448429]
統計的偏りは有用である場合もあるが,精度が向上しない場合が多い。
次に、人口統計と位置特性の相関を利用して、人口統計の正確な推定を行うニューラルネットワーク手法であるBiasBusterを提案する。
論文 参考訳(メタデータ) (2024-02-17T16:16:24Z) - DSAP: Analyzing Bias Through Demographic Comparison of Datasets [4.8741052091630985]
DSAP(Demographic similarity from Auxiliary Profiles)は、2つのデータセットの人口構成を比較するための2段階の手法である。
DSAPは3つの主要なアプリケーションにデプロイすることができる。データセット間での人口統計学的盲点とバイアスの問題の検出と特徴付け、単一のデータセットにおけるデータセットの人口統計学的バイアスの測定、デプロイメントシナリオにおけるデータセットの人口統計学的シフトの測定である。
DSAPの重要な特徴は、明示的な人口統計ラベルなしでデータセットを堅牢に分析し、広範囲の状況に対してシンプルで解釈可能な機能を提供することである。
論文 参考訳(メタデータ) (2023-12-22T11:51:20Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - Biases in human mobility data impact epidemic modeling [0.0]
携帯電話の不正アクセスと不平等使用による2種類のバイアスを同定する。
我々は、高重量個体が過剰に表現されているすべての調査データセットにおいて、データ生成バイアスの証拠を見つける。
このスキューを緩和するために、データをデバイアスするフレームワークを提案し、代表性を高めるためにいかに簡単なテクニックが使えるかを示す。
論文 参考訳(メタデータ) (2021-12-23T13:20:54Z) - Towards Measuring Bias in Image Classification [61.802949761385]
畳み込みニューラルネットワーク(CNN)は、主要なコンピュータビジョンタスクの最先端技術となっている。
しかし、複雑な構造のため、その決定は産業世界の何らかの文脈での使用を制限するかを理解することは困難である。
帰属マップによるデータのバイアスを明らかにするための体系的なアプローチを提案する。
論文 参考訳(メタデータ) (2021-07-01T10:50:39Z) - Leveraging Administrative Data for Bias Audits: Assessing Disparate
Coverage with Mobility Data for COVID-19 Policy [61.60099467888073]
管理データのリンクによって,バイアスに対するモビリティデータの監査が可能かを示す。
我々は、高齢者や非白人の有権者が移動データによって捕えられる可能性が低いことを示した。
このような移動データに基づく公衆衛生資源の配分は、高リスク高齢者や少数民族に不当に害を与える可能性があることを示す。
論文 参考訳(メタデータ) (2020-11-14T02:04:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。