論文の概要: Data Bias in Human Mobility is a Universal Phenomenon but is Highly Location-specific
- arxiv url: http://arxiv.org/abs/2508.00149v1
- Date: Thu, 31 Jul 2025 20:19:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-04 18:08:53.664261
- Title: Data Bias in Human Mobility is a Universal Phenomenon but is Highly Location-specific
- Title(参考訳): 人体移動におけるデータバイアスは普遍現象であるが、位置特異性が高い
- Authors: Katinka den Nijs, Elisa Omodei, Vedran Sekara,
- Abstract要約: 我々は「データ生産」を研究し、個人が大きなデジタルデータセットで表現されているかどうかを定量化するとともに、そのデータ生成量の観点からどのように表現されているのかを定量化する。
我々は、米国の主要10都市を対象に、匿名化されたスマートフォンから収集したGPSモビリティデータを調査し、データポイントが富よりもユーザ間で不平等に分散できることを発見した。
我々は、国勢調査区域に居住する人口集団によるデータポイントの数を予測するモデルを構築し、富、民族、教育がデータ生産に与える影響を強く見出す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-scale human mobility datasets play increasingly critical roles in many algorithmic systems, business processes and policy decisions. Unfortunately there has been little focus on understanding bias and other fundamental shortcomings of the datasets and how they impact downstream analyses and prediction tasks. In this work, we study `data production', quantifying not only whether individuals are represented in big digital datasets, but also how they are represented in terms of how much data they produce. We study GPS mobility data collected from anonymized smartphones for ten major US cities and find that data points can be more unequally distributed between users than wealth. We build models to predict the number of data points we can expect to be produced by the composition of demographic groups living in census tracts, and find strong effects of wealth, ethnicity, and education on data production. While we find that bias is a universal phenomenon, occurring in all cities, we further find that each city suffers from its own manifestation of it, and that location-specific models are required to model bias for each city. This work raises serious questions about general approaches to debias human mobility data and urges further research.
- Abstract(参考訳): 大規模なヒューマンモビリティデータセットは、多くのアルゴリズムシステム、ビジネスプロセス、ポリシー決定において、ますます重要な役割を担っている。
残念ながら、バイアスやその他のデータセットの根本的な欠点を理解し、下流の分析や予測タスクにどのように影響するかを理解することにはほとんど焦点が当てられていない。
本研究では、大規模デジタルデータセットに個人が表現されているかどうかを定量化するとともに、生成するデータ量の観点から、個人がどのように表現されているかを明らかにする。
我々は、米国の主要10都市を対象に、匿名化されたスマートフォンから収集したGPSモビリティデータを調査し、データポイントが富よりもユーザ間で不平等に分散できることを発見した。
我々は、国勢調査区域に居住する人口集団によるデータポイントの数を予測するモデルを構築し、富、民族、教育がデータ生産に与える影響を強く見出す。
偏見は、すべての都市で発生する普遍的な現象であるが、各都市が独自の偏見に悩まされていること、そして各都市の偏見をモデル化するためには、位置特化モデルが必要であること等が分かる。
この研究は、人間の移動データをデバイアス化するための一般的なアプローチに関する深刻な疑問を提起し、さらなる研究を促している。
関連論文リスト
- Enriching Datasets with Demographics through Large Language Models: What's in a Name? [5.871504332441324]
LLM(Large Language Models)は、特殊なデータに基づいてトレーニングされた振る舞いモデルだけでなく、パフォーマンスも向上する。
香港の認可された金融専門家の実際のデータセットを含む、さまざまなデータセットにこれらのLCMを適用します。
論文 参考訳(メタデータ) (2024-09-17T18:40:49Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - DSAP: Analyzing Bias Through Demographic Comparison of Datasets [4.8741052091630985]
DSAP(Demographic similarity from Auxiliary Profiles)は、2つのデータセットの人口構成を比較するための2段階の手法である。
DSAPは3つの主要なアプリケーションにデプロイすることができる。データセット間での人口統計学的盲点とバイアスの問題の検出と特徴付け、単一のデータセットにおけるデータセットの人口統計学的バイアスの測定、デプロイメントシナリオにおけるデータセットの人口統計学的シフトの測定である。
DSAPの重要な特徴は、明示的な人口統計ラベルなしでデータセットを堅牢に分析し、広範囲の状況に対してシンプルで解釈可能な機能を提供することである。
論文 参考訳(メタデータ) (2023-12-22T11:51:20Z) - Assessing Demographic Bias Transfer from Dataset to Model: A Case Study
in Facial Expression Recognition [1.5340540198612824]
2つのメトリクスはデータセットの表現バイアスとステレオタイプバイアスに焦点をあて、もう1つはトレーニングされたモデルの残差バイアスに焦点を当てている。
本稿では、一般的なAffectnetデータセットに基づくFER問題に適用することで、メトリクスの有用性を示す。
論文 参考訳(メタデータ) (2022-05-20T09:40:42Z) - Pseudo-PFLOW: Development of nationwide synthetic open dataset for
people movement based on limited travel survey and open statistical data [4.243926243206826]
人フローデータは、都市や商業計画、災害管理など様々な分野で活用されている。
本研究では,一般統計と旅行調査データを組み合わせた擬似人流データを開発した。
論文 参考訳(メタデータ) (2022-05-02T05:13:53Z) - StyleGAN-Human: A Data-Centric Odyssey of Human Generation [96.7080874757475]
この研究は、データ中心の観点から、"データエンジニアリング"における複数の重要な側面を調査します。
さまざまなポーズやテクスチャを抽出した230万以上のサンプルで、大規模な人間の画像データセットを収集し、注釈付けします。
本稿では,データサイズ,データ分布,データアライメントといった,スタイルGANに基づく人為的生成のためのデータ工学における3つの重要な要素について精査する。
論文 参考訳(メタデータ) (2022-04-25T17:55:08Z) - Representation Bias in Data: A Survey on Identification and Resolution
Techniques [26.142021257838564]
データ駆動型アルゴリズムは、それらが扱うデータと同程度にしか機能しないが、データセット、特にソーシャルデータはしばしば、マイノリティを適切に表現できない。
データにおける表現バイアスは、歴史的差別から、データ取得と作成方法におけるバイアスのサンプリングまで、さまざまな理由により起こりうる。
本稿では,後日どのように消費されるかに関わらず,表現バイアスをデータセットの特徴として同定し,解決する方法についての文献をレビューする。
論文 参考訳(メタデータ) (2022-03-22T16:30:22Z) - Biases in human mobility data impact epidemic modeling [0.0]
携帯電話の不正アクセスと不平等使用による2種類のバイアスを同定する。
我々は、高重量個体が過剰に表現されているすべての調査データセットにおいて、データ生成バイアスの証拠を見つける。
このスキューを緩和するために、データをデバイアスするフレームワークを提案し、代表性を高めるためにいかに簡単なテクニックが使えるかを示す。
論文 参考訳(メタデータ) (2021-12-23T13:20:54Z) - Towards Measuring Bias in Image Classification [61.802949761385]
畳み込みニューラルネットワーク(CNN)は、主要なコンピュータビジョンタスクの最先端技術となっている。
しかし、複雑な構造のため、その決定は産業世界の何らかの文脈での使用を制限するかを理解することは困難である。
帰属マップによるデータのバイアスを明らかにするための体系的なアプローチを提案する。
論文 参考訳(メタデータ) (2021-07-01T10:50:39Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z) - Urban Sensing based on Mobile Phone Data: Approaches, Applications and
Challenges [67.71975391801257]
モバイルデータ分析における多くの関心は、人間とその行動に関連している。
本研究の目的は,携帯電話データから知識を発見するために実装された手法や手法をレビューすることである。
論文 参考訳(メタデータ) (2020-08-29T15:14:03Z) - REVISE: A Tool for Measuring and Mitigating Bias in Visual Datasets [64.76453161039973]
REVISE(Revealing VIsual biaSEs)は、視覚的データセットの調査を支援するツールである。
1)オブジェクトベース,(2)個人ベース,(3)地理ベースという3つの次元に沿った潜在的なバイアスを呈示する。
論文 参考訳(メタデータ) (2020-04-16T23:54:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。