論文の概要: Biases in human mobility data impact epidemic modeling
- arxiv url: http://arxiv.org/abs/2112.12521v1
- Date: Thu, 23 Dec 2021 13:20:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-03 17:48:51.287638
- Title: Biases in human mobility data impact epidemic modeling
- Title(参考訳): 人体移動データ衝突流行モデルにおけるバイアス
- Authors: Frank Schlosser, Vedran Sekara, Dirk Brockmann, Manuel Garcia-Herranz
- Abstract要約: 携帯電話の不正アクセスと不平等使用による2種類のバイアスを同定する。
我々は、高重量個体が過剰に表現されているすべての調査データセットにおいて、データ生成バイアスの証拠を見つける。
このスキューを緩和するために、データをデバイアスするフレームワークを提案し、代表性を高めるためにいかに簡単なテクニックが使えるかを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-scale human mobility data is a key resource in data-driven policy
making and across many scientific fields. Most recently, mobility data was
extensively used during the COVID-19 pandemic to study the effects of
governmental policies and to inform epidemic models. Large-scale mobility is
often measured using digital tools such as mobile phones. However, it remains
an open question how truthfully these digital proxies represent the actual
travel behavior of the general population. Here, we examine mobility datasets
from multiple countries and identify two fundamentally different types of bias
caused by unequal access to, and unequal usage of mobile phones. We introduce
the concept of data generation bias, a previously overlooked type of bias,
which is present when the amount of data that an individual produces influences
their representation in the dataset. We find evidence for data generation bias
in all examined datasets in that high-wealth individuals are overrepresented,
with the richest 20% contributing over 50% of all recorded trips, substantially
skewing the datasets. This inequality is consequential, as we find mobility
patterns of different wealth groups to be structurally different, where the
mobility networks of high-wealth users are denser and contain more long-range
connections. To mitigate the skew, we present a framework to debias data and
show how simple techniques can be used to increase representativeness. Using
our approach we show how biases can severely impact outcomes of dynamic
processes such as epidemic simulations, where biased data incorrectly estimates
the severity and speed of disease transmission. Overall, we show that a failure
to account for biases can have detrimental effects on the results of studies
and urge researchers and practitioners to account for data-fairness in all
future studies of human mobility.
- Abstract(参考訳): 大規模なヒューマンモビリティデータは、多くの科学分野において、データ駆動型ポリシー作成における重要なリソースである。
最近では、新型コロナウイルス(COVID-19)のパンデミック(パンデミック)で、政府の政策の影響を調査し、流行モデルに通知するために、モビリティデータが広く使用された。
大規模な移動度はしばしば携帯電話などのデジタルツールを用いて測定される。
しかし、これらのデジタルプロキシが一般市民の実際の移動行動をどのように表現しているかは、まだ明らかな疑問である。
本稿では,複数の国からのモビリティデータセットを調査し,携帯電話の不正アクセスと不等使用に起因する2つの根本的なバイアスを同定する。
データ生成バイアスという概念は,個人が生成するデータの量がデータセット内の表現に影響を及ぼす場合に発生する,これまで見過ごされていたバイアスである。
調査されたデータセットすべてにおいてデータ生成バイアスの証拠を見いだし、最も富裕な20%が記録されたトリップの50%以上を寄与し、実質的にデータセットを歪めている。
この不等式は、異なる富のグループの移動パターンが構造的に異なるため、高富の利用者の移動ネットワークはより密で、より長距離接続を含んでいる。
歪を緩和するために,データをデバイアスする枠組みを提示し,代表性を高めるためにいかに簡単なテクニックを使用できるかを示す。
この手法を用いることで、バイアスが疫病シミュレーションなどの動的プロセスの結果にどのように影響するかを示し、バイアスデータを誤って病気の感染の重症度や速さを推定する。
全体として、バイアスを考慮できないことは、研究結果に有害な影響を及ぼし、研究者や実践者に、将来の移動に関するあらゆる研究において、データフェアネスを考慮するよう促すことが示される。
関連論文リスト
- Will the Inclusion of Generated Data Amplify Bias Across Generations in Future Image Classification Models? [29.71939692883025]
画像分類タスクにおける生成データの影響について,特にバイアスに着目して検討する。
数百の実験がColorized MNIST、CIFAR-20/100、Hard ImageNetデータセットで実施されている。
本研究は, 実世界の応用において, 合成データの公平性に関する議論が進行中であることを示すものである。
論文 参考訳(メタデータ) (2024-10-14T05:07:06Z) - Fast Model Debias with Machine Unlearning [54.32026474971696]
ディープニューラルネットワークは多くの現実世界のシナリオでバイアスのある振る舞いをする。
既存のデバイアス法は、バイアスラベルやモデル再トレーニングのコストが高い。
バイアスを特定し,評価し,除去するための効率的なアプローチを提供する高速モデル脱バイアスフレームワーク(FMD)を提案する。
論文 参考訳(メタデータ) (2023-10-19T08:10:57Z) - Learning for Counterfactual Fairness from Observational Data [62.43249746968616]
公正な機械学習は、人種、性別、年齢などの特定の保護された(感受性のある)属性によって記述されるある種のサブグループに対して、学習モデルのバイアスを取り除くことを目的としている。
カウンターファクトフェアネスを達成するための既存の手法の前提条件は、データに対する因果モデルの事前の人間の知識である。
本研究では,新しいフレームワークCLAIREを提案することにより,因果関係を付与せずに観測データから対実的に公正な予測を行う問題に対処する。
論文 参考訳(メタデータ) (2023-07-17T04:08:29Z) - Analyzing Bias in Diffusion-based Face Generation Models [75.80072686374564]
拡散モデルは、合成データ生成と画像編集アプリケーションでますます人気がある。
本研究では, 性別, 人種, 年齢などの属性に関して, 拡散型顔生成モデルにおけるバイアスの存在について検討する。
本研究は,GAN(Generative Adversarial Network)とGAN(Generative Adversarial Network)をベースとした顔生成モデルにおいて,データセットサイズが属性組成および知覚品質に与える影響について検討する。
論文 参考訳(メタデータ) (2023-05-10T18:22:31Z) - Non-Invasive Fairness in Learning through the Lens of Data Drift [88.37640805363317]
データや学習アルゴリズムを変更することなく、機械学習モデルの公平性を向上する方法を示す。
異なる集団間の傾向のばらつきと、学習モデルと少数民族間の連続的な傾向は、データドリフトと類似している。
このドリフトを解決するための2つの戦略(モデル分割とリウィーディング)を探索し、基礎となるデータに対するモデル全体の適合性を改善することを目的としている。
論文 参考訳(メタデータ) (2023-03-30T17:30:42Z) - A fairness assessment of mobility-based COVID-19 case prediction models [0.0]
予測モデルのトレーニングに使用されるモビリティデータのバイアスが、特定の人口集団に対して不当に精度の低い予測に繋がる可能性があるという仮説を検証した。
特に、モデルは大きく、高度に教育され、富裕な若者、都市、非黒人が支配する郡を好む傾向にある。
論文 参考訳(メタデータ) (2022-10-08T03:43:51Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - Data Representativeness in Accessibility Datasets: A Meta-Analysis [7.6597163467929805]
障害のある人と高齢者が作成したデータセットをレビューする。
アクセシビリティデータセットは様々な年齢を表すが、性別と人種の差がある。
われわれの努力が、AIに注入されたシステムに、余分なコミュニティをもっと取り入れる可能性の空間を広げることを願っている。
論文 参考訳(メタデータ) (2022-07-16T23:32:19Z) - Assessing Demographic Bias Transfer from Dataset to Model: A Case Study
in Facial Expression Recognition [1.5340540198612824]
2つのメトリクスはデータセットの表現バイアスとステレオタイプバイアスに焦点をあて、もう1つはトレーニングされたモデルの残差バイアスに焦点を当てている。
本稿では、一般的なAffectnetデータセットに基づくFER問題に適用することで、メトリクスの有用性を示す。
論文 参考訳(メタデータ) (2022-05-20T09:40:42Z) - Generating synthetic mobility data for a realistic population with RNNs
to improve utility and privacy [3.3918638314432936]
本稿では, ディープリカレントニューラルネットワーク(RNN)を用いた合成モビリティデータ生成システムを提案する。
本システムは, 個体群分布を入力として, 対応する合成個体群の移動トレースを生成する。
生成したモビリティデータは,個々のレベルでの実際のデータから変化しながら,実際のデータの特徴を保っていることを示す。
論文 参考訳(メタデータ) (2022-01-04T13:58:22Z) - Leveraging Administrative Data for Bias Audits: Assessing Disparate
Coverage with Mobility Data for COVID-19 Policy [61.60099467888073]
管理データのリンクによって,バイアスに対するモビリティデータの監査が可能かを示す。
我々は、高齢者や非白人の有権者が移動データによって捕えられる可能性が低いことを示した。
このような移動データに基づく公衆衛生資源の配分は、高リスク高齢者や少数民族に不当に害を与える可能性があることを示す。
論文 参考訳(メタデータ) (2020-11-14T02:04:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。