論文の概要: Mind the Gaps: Auditing and Reducing Group Inequity in Large-Scale Mobility Prediction
- arxiv url: http://arxiv.org/abs/2510.26940v1
- Date: Thu, 30 Oct 2025 18:54:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:15.895067
- Title: Mind the Gaps: Auditing and Reducing Group Inequity in Large-Scale Mobility Prediction
- Title(参考訳): Mind the Gaps: 大規模モビリティ予測におけるグループ不平等の監査と削減
- Authors: Ashwin Kumar, Hanyu Zhang, David A. Schweidel, William Yeoh,
- Abstract要約: 次のロケーション予測は、モビリティ、小売、公衆衛生のアプリケーションの増加を支えている。
本稿では,大規模データセット上で訓練された最先端のモビリティ予測モデルを評価する。
基礎となるデータセットから生じる系統的な差異が示され、位置とユーザグループに基づいて精度に大きな違いが生じる。
- 参考スコア(独自算出の注目度): 9.369284351516358
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Next location prediction underpins a growing number of mobility, retail, and public-health applications, yet its societal impacts remain largely unexplored. In this paper, we audit state-of-the-art mobility prediction models trained on a large-scale dataset, highlighting hidden disparities based on user demographics. Drawing from aggregate census data, we compute the difference in predictive performance on racial and ethnic user groups and show a systematic disparity resulting from the underlying dataset, resulting in large differences in accuracy based on location and user groups. To address this, we propose Fairness-Guided Incremental Sampling (FGIS), a group-aware sampling strategy designed for incremental data collection settings. Because individual-level demographic labels are unavailable, we introduce Size-Aware K-Means (SAKM), a clustering method that partitions users in latent mobility space while enforcing census-derived group proportions. This yields proxy racial labels for the four largest groups in the state: Asian, Black, Hispanic, and White. Built on these labels, our sampling algorithm prioritizes users based on expected performance gains and current group representation. This method incrementally constructs training datasets that reduce demographic performance gaps while preserving overall accuracy. Our method reduces total disparity between groups by up to 40\% with minimal accuracy trade-offs, as evaluated on a state-of-art MetaPath2Vec model and a transformer-encoder model. Improvements are most significant in early sampling stages, highlighting the potential for fairness-aware strategies to deliver meaningful gains even in low-resource settings. Our findings expose structural inequities in mobility prediction pipelines and demonstrate how lightweight, data-centric interventions can improve fairness with little added complexity, especially for low-data applications.
- Abstract(参考訳): 次の位置予測は、モビリティ、小売、公衆衛生のアプリケーションの増加を支えているが、その社会的影響は明らかにされていない。
本稿では,大規模データセット上で訓練された最先端のモビリティ予測モデルを監査し,ユーザ人口統計に基づく隠れた格差を明らかにする。
集計された国勢調査データから、人種的および民族的ユーザグループにおける予測性能の差を計算し、基礎となるデータセットから生じる体系的な差異を示し、位置とユーザグループに基づく精度の大きな違いをもたらす。
そこで我々はFGIS(Fairness-Guided Incremental Smpling)を提案する。
個人レベルの人口統計ラベルは利用できないため、国勢調査由来のグループ比率を強制しながら、潜在移動空間でユーザを分割するクラスタリング手法であるSize-Aware K-Means(SAKM)を導入する。
これは州内で4大グループであるアジア、黒人、ヒスパニック、白人の代理的な人種ラベルである。
これらのラベルに基づいて構築されたサンプリングアルゴリズムは、期待される性能向上と現在のグループ表現に基づいてユーザを優先順位付けする。
この方法は、全体的な精度を保ちながら、人口動態のパフォーマンスギャップを低減するトレーニングデータセットを漸進的に構築する。
提案手法は,最先端のMetaPath2Vecモデルと変圧器エンコーダモデルを用いて評価し,最小限の精度でグループ間の全格差を最大40 %削減する。
早期サンプリングの段階では改善が最も重要であり、低リソース環境においても、フェアネスを意識した戦略が有意義な利益をもたらす可能性を浮き彫りにしている。
我々の研究は、モビリティ予測パイプラインの構造的不等式を明らかにし、特に低データアプリケーションにおいて、複雑さをほとんど加えずに、軽量でデータ中心の介入が公正性を改善することを実証した。
関連論文リスト
- C2AL: Cohort-Contrastive Auxiliary Learning for Large-scale Recommendation Systems [7.548682352355034]
共有埋め込み選択のための因子化機械において,注意機構が重要な役割を担っていることを示す。
本稿では、データセットのサブ構造を分析し、補助学習を通して強力な分布コントラストを持つ構造を明らかにすることで、この問題に対処することを提案する。
このアプローチは、注目層の学習プロセスをカスタマイズし、少数派コホートとの相互情報を保護し、グローバルなパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-10-02T17:00:17Z) - Fairness for the People, by the People: Minority Collective Action [50.29077265863936]
機械学習モデルは、トレーニングデータに存在するバイアスを保存し、一部の少数民族を不公平に扱う。
我々は,企業のトレーニングプロセスを変更することなく,公正性を高めるために,自らのデータを戦略的に再ラベルする調整されたマイノリティグループを提案する。
以上の結果から,少数民族のサブグループは,全体の予測誤差に少なからぬ影響で,不公平さを著しく低減できることが明らかとなった。
論文 参考訳(メタデータ) (2025-08-21T09:09:39Z) - Optimal Transport-based Domain Alignment as a Preprocessing Step for Federated Learning [0.48342038441006796]
Federated Learning(FL)は、機械学習のサブフィールドであり、ローカルデータを中央サーバと共有することを避ける。
FLでは、局所的に訓練されたモデルと不均衡なデータセットを融合させることで、グローバルモデルアグリゲーションの性能が低下する可能性がある。
本稿では,エッジデバイスに沿ったデータの分布差を最小化してデータセットを整列する,最適なトランスポートベースの前処理アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-04T15:35:55Z) - Dataset Representativeness and Downstream Task Fairness [24.570493924073524]
そのデータセット上で訓練された分類器のデータセット代表性とグループフェアネスとの間に自然な緊張関係があることを実証する。
また、過度にサンプル化されていない群は、それらの群に偏りを示す分類器を生じる可能性があることも見出した。
論文 参考訳(メタデータ) (2024-06-28T18:11:16Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。