論文の概要: A Bayesian Spatial Model to Correct Under-Reporting in Urban
Crowdsourcing
- arxiv url: http://arxiv.org/abs/2312.11754v1
- Date: Mon, 18 Dec 2023 23:40:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 17:35:29.332388
- Title: A Bayesian Spatial Model to Correct Under-Reporting in Urban
Crowdsourcing
- Title(参考訳): ベイズ空間モデルによる都市クラウドソーシングにおける未報告の補正
- Authors: Gabriel Agostini, Emma Pierson, Nikhil Garg
- Abstract要約: 意思決定者は、しばしば報告プロセスを通じてイベントの発生を観察する。
イベントが空間的に相関しているという事実を活用することで、この課題を克服する方法を示す。
- 参考スコア(独自算出の注目度): 1.850972250657274
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decision-makers often observe the occurrence of events through a reporting
process. City governments, for example, rely on resident reports to find and
then resolve urban infrastructural problems such as fallen street trees,
flooded basements, or rat infestations. Without additional assumptions, there
is no way to distinguish events that occur but are not reported from events
that truly did not occur--a fundamental problem in settings with
positive-unlabeled data. Because disparities in reporting rates correlate with
resident demographics, addressing incidents only on the basis of reports leads
to systematic neglect in neighborhoods that are less likely to report events.
We show how to overcome this challenge by leveraging the fact that events are
spatially correlated. Our framework uses a Bayesian spatial latent variable
model to infer event occurrence probabilities and applies it to storm-induced
flooding reports in New York City, further pooling results across multiple
storms. We show that a model accounting for under-reporting and spatial
correlation predicts future reports more accurately than other models, and
further induces a more equitable set of inspections: its allocations better
reflect the population and provide equitable service to non-white, less
traditionally educated, and lower-income residents. This finding reflects
heterogeneous reporting behavior learned by the model: reporting rates are
higher in Census tracts with higher populations, proportions of white
residents, and proportions of owner-occupied households. Our work lays the
groundwork for more equitable proactive government services, even with
disparate reporting behavior.
- Abstract(参考訳): 意思決定者はしばしば報告プロセスを通じて出来事を観察する。
例えば、市政府は、倒れた街路樹、浸水した地下室、ネズミの感染などの都市インフラの問題を見つけ、解決するために住民の報告に頼っている。
追加の仮定がなければ、発生したイベントを区別する手段はないが、本当に発生しなかったイベントからは報告されない。
報告率の格差は住民人口と相関するため、報告に基づいてのみ事件に対処することは、出来事を報告しにくい地区では体系的に無視される。
イベントが空間的に相関しているという事実を利用して,この課題を克服する方法を示す。
筆者らは, ベイズ空間潜伏変動モデルを用いて, 地震発生確率を推定し, ニューヨーク市の豪雨による洪水報告に適用し, さらに複数の嵐にまたがって結果を収集した。
報告不足と空間的相関を考慮に入れたモデルが,他のモデルよりも正確な将来の報告を予測し,さらに,人口を反映し,非白人・非伝統的・低所得層への公平なサービスの提供という,より公平な検査のセットを導出することを示す。
この発見は、このモデルが学んだ異質な報告行動の反映である: 人口の多い国勢調査管では報告率は高く、白人人口の割合は高く、所有者が占める世帯の割合は高い。
我々の研究は、異なる報告行動であっても、より公平なプロアクティブな政府サービスの基盤となる。
関連論文リスト
- BiasBuster: a Neural Approach for Accurate Estimation of Population
Statistics using Biased Location Data [6.077198822448429]
統計的偏りは有用である場合もあるが,精度が向上しない場合が多い。
次に、人口統計と位置特性の相関を利用して、人口統計の正確な推定を行うニューラルネットワーク手法であるBiasBusterを提案する。
論文 参考訳(メタデータ) (2024-02-17T16:16:24Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - An Ordinal Latent Variable Model of Conflict Intensity [59.49424978353101]
ゴールドスタインスケール(Goldstein scale)は、紛争・協力的なスケールでイベントをスコアする、広く使われている専門家ベースの尺度である。
本稿では、競合強度を測定するために、潜伏変数に基づくアプローチをとる。
論文 参考訳(メタデータ) (2022-10-08T08:59:17Z) - Examining Data Imbalance in Crowdsourced Reports for Improving Flash
Flood Situational Awareness [0.965964228590342]
我々は,2019年の熱帯低気圧イメルダと2021年のハリケーン・アイダの余波から収集された3-1-1,Wazeの報告,FEMAの被害データを解析した。
2つの地理的アグリゲーションを見ると、より大きな空間アグリゲーション、国勢調査トラクションが結果に不均衡を示さないことがわかった。
3-1とWazeの報告では、少数民族が居住する地域ではデータ不均衡の制限があることがわかった。
論文 参考訳(メタデータ) (2022-07-12T19:26:43Z) - Quantifying Spatial Under-reporting Disparities in Resident
Crowdsourcing [5.701305404173138]
我々は,外部の地中構造データを用いることなく,報告遅延を識別する手法を開発した。
この方法は、ニューヨーク市で10万件以上、シカゴで90万件以上の報告に当てはめます。
論文 参考訳(メタデータ) (2022-04-19T02:54:16Z) - The World of an Octopus: How Reporting Bias Influences a Language
Model's Perception of Color [73.70233477125781]
報告バイアスがテキストのみのトレーニングに悪影響を及ぼし、本質的に制限されていることを示す。
次に、マルチモーダルモデルが視覚的トレーニングを利用してこれらの効果を緩和できることを実証する。
論文 参考訳(メタデータ) (2021-10-15T16:28:17Z) - Balancing out Bias: Achieving Fairness Through Training Reweighting [58.201275105195485]
自然言語処理におけるバイアスは、性別や人種などの著者の特徴を学習するモデルから生じる。
既存のバイアスの緩和と測定方法は、著者の人口統計学と言語変数の相関を直接考慮していない。
本稿では,インスタンス再重み付けを用いたバイアス対策法を提案する。
論文 参考訳(メタデータ) (2021-09-16T23:40:28Z) - Priority prediction of Asian Hornet sighting report using machine
learning methods [0.0]
アジアのジャイアント・ホーネット(Vespa mandarinia)は、ミツバチのコロニーだけでなく、地元のアピカルチャーにも被害を与えている。
本稿では,機械学習に基づく目撃レポートの優先順位予測手法を提案する。
論文 参考訳(メタデータ) (2021-06-28T07:33:53Z) - Emergency Incident Detection from Crowdsourced Waze Data using Bayesian
Information Fusion [4.039649741925056]
本稿では,ノイズの多いクラウドソーシングWazeデータを用いた緊急インシデント検出手法を提案する。
本稿では,クラウドレポートの信頼性の不確かさをモデル化するための観測理論に基づく計算手法を提案する。
論文 参考訳(メタデータ) (2020-11-10T22:45:03Z) - On Disentangled Representations Learned From Correlated Data [59.41587388303554]
相関データに対する最も顕著な絡み合うアプローチの挙動を解析することにより、現実のシナリオにギャップを埋める。
本研究では,データセットの体系的相関が学習され,潜在表現に反映されていることを示す。
また、トレーニング中の弱い監督や、少数のラベルで事前訓練されたモデルを修正することで、これらの潜伏相関を解消する方法を実証する。
論文 参考訳(メタデータ) (2020-06-14T12:47:34Z) - Showing Your Work Doesn't Always Work [73.63200097493576]
『Show Your Work: Improved Reporting of Experimental Results』では、最高の学習モデルの有効性を報告している。
解析的にそれらの推定器は偏りがあり、エラーを起こしやすい仮定を用いていることを示す。
我々は、偏見のない代替案を導き、統計的シミュレーションから経験的な証拠で主張を裏付ける。
論文 参考訳(メタデータ) (2020-04-28T17:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。