論文の概要: Quantifying Spatial Under-reporting Disparities in Resident
Crowdsourcing
- arxiv url: http://arxiv.org/abs/2204.08620v3
- Date: Sun, 9 Jul 2023 21:52:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-11 19:34:22.058593
- Title: Quantifying Spatial Under-reporting Disparities in Resident
Crowdsourcing
- Title(参考訳): クラウドソーシングにおける空間的未報告格差の定量化
- Authors: Zhi Liu, Uma Bhandaram, Nikhil Garg
- Abstract要約: 我々は,外部の地中真実データを用いることなく,(不均一な)報告遅延を識別する手法を開発した。
この方法は、ニューヨーク市で10万件以上、シカゴで90万件以上の報告に当てはめます。
- 参考スコア(独自算出の注目度): 8.513280511261751
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern city governance relies heavily on crowdsourcing (``co-production'') to
identify problems such as downed trees and power-lines. A major concern is that
residents do not report problems at the same rates, with heterogeneous
reporting delays directly translating to downstream disparities in how quickly
incidents can be addressed. Measuring such under-reporting is a difficult
statistical task, as, by definition, we do not observe incidents that are not
reported or when reported incidents first occurred. Thus, low reporting rates
and low ground-truth incident rates cannot be naively distinguished, and
reporting delays are unobserved. We develop a method to identify
(heterogeneous) reporting delays, without using external ground truth data. Our
insight is that rates on \textit{duplicate} reports about the same incident can
be leveraged to disambiguate whether an incident has occurred with its
reporting rate once it has occurred. Using this idea, we reduce the question to
a standard Poisson rate estimation task -- even though the full incident
reporting interval is also unobserved.
We apply our method to over 100,000 resident reports made in New York City
and to over 900,000 reports made in Chicago, finding that there are substantial
spatial disparities in how quickly incidents are reported, even after
controlling for incident characteristics -- some neighborhoods report three
times as quickly as do others. These spatial disparities correspond to
socio-economic characteristics: in NYC, higher population density, fraction of
people with college degrees, income, and fraction of population that is White
all positively correlate with reporting rates.
Finally, leveraging a collaboration with the NYC Department of Parks and
Recreation, we demonstrate how estimating reporting delays leads to
\textit{practical} insights and interventions for more equitable, efficient
government service.
- Abstract(参考訳): 現代の都市ガバナンスは、倒木や電力線といった問題を特定するためにクラウドソーシング(‘コプロダクション’)に大きく依存している。
主な懸念は、住民が同じレートで問題を報告しないことである。不均質な報告遅延は、インシデントがいかに迅速に対処できるかで下流の格差に直接翻訳される。
このようなアンダーレポートの測定は、定義上、報告されていないインシデントや報告されたインシデントの発生を観測しないため、難しい統計的タスクである。
したがって、低報告率と低地動事故率をナレーション的に区別することはできず、報告遅延は観測されない。
外部の根拠データを用いずに(ヘテロジェンシーな)報告遅延を識別する手法を開発した。
当社の見解では、同じインシデントに関する \textit{duplicate}レポートのレートは、インシデントが発生した後にそのインシデントがレポートレートで発生したかどうかを曖昧化するために利用することができる。
このアイデアを用いて、我々は、標準的なポアソンレート推定タスク -- 完全なインシデント報告間隔が守られていないにもかかわらず。我々は、ニューヨークで作成された10万以上のインシデントレポートと、シカゴで作成された90万以上のレポートに適用し、インシデント特性を制御した後でも、インシデントがいかに早く報告されるかにかなりの空間的差異があることを見出します。
これらの空間的格差は社会経済的特徴に対応しており、ニューヨーク市では人口密度が高く、大学の学位を持つ人の比率、収入、人口の比率は報告率と正の相関がある。
最後に、ニューヨーク市公園・レクリエーション省との協力を利用して、レポートの遅延を見積もると、より公平で効率的な政府サービスのための‘textit{practical}の洞察と介入につながるかを実証する。
関連論文リスト
- How to Train Your Fact Verifier: Knowledge Transfer with Multimodal Open Models [95.44559524735308]
大規模言語またはマルチモーダルモデルに基づく検証は、偽コンテンツや有害コンテンツの拡散を緩和するためのオンラインポリシングメカニズムをスケールアップするために提案されている。
我々は,知識伝達の初期研究を通じて,継続的な更新を行うことなく基礎モデルの性能向上の限界をテストする。
最近の2つのマルチモーダルなファクトチェックベンチマークであるMochegとFakedditの結果は、知識伝達戦略がファクドディットのパフォーマンスを最先端よりも1.7%向上し、Mochegのパフォーマンスを2.9%向上させることができることを示唆している。
論文 参考訳(メタデータ) (2024-06-29T08:39:07Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - A Bayesian Spatial Model to Correct Under-Reporting in Urban
Crowdsourcing [1.850972250657274]
意思決定者は、しばしば報告プロセスを通じてイベントの発生を観察する。
イベントが空間的に相関しているという事実を活用することで、この課題を克服する方法を示す。
論文 参考訳(メタデータ) (2023-12-18T23:40:56Z) - Evaluation of Crowdsourced Data on Unplowed Roads [0.0]
本研究では,クラウドソース・トランスポート・データ・プロバイダであるWazeの新たな未耕起道路データセットを評価する。
報告の81%は雪のイベントに近いものであり、偽陽性は州全体で1日当たり10回程度の割合で発生していた。
ソーシャルメディア上のターゲットメッセージを通じてWazeの未公開道路報告を促進する努力は、参加を増やさなかった。
論文 参考訳(メタデータ) (2023-10-25T15:48:50Z) - Practitioner-Centric Approach for Early Incident Detection Using
Crowdsourced Data for Emergency Services [2.5328886773979375]
Wazeのようなクラウドソーシングプラットフォームは、インシデントを早期に特定する機会を提供する。
クラウドソースデータストリームからのインシデントを検出することは,このようなデータに関連するノイズや不確実性の難しさから難しい。
本稿では,クラウドソーシングデータを用いた実践者中心インシデント検出のための新しい問題定式化と解法を提案する。
論文 参考訳(メタデータ) (2021-12-03T16:51:41Z) - Priority prediction of Asian Hornet sighting report using machine
learning methods [0.0]
アジアのジャイアント・ホーネット(Vespa mandarinia)は、ミツバチのコロニーだけでなく、地元のアピカルチャーにも被害を与えている。
本稿では,機械学習に基づく目撃レポートの優先順位予測手法を提案する。
論文 参考訳(メタデータ) (2021-06-28T07:33:53Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Emergency Incident Detection from Crowdsourced Waze Data using Bayesian
Information Fusion [4.039649741925056]
本稿では,ノイズの多いクラウドソーシングWazeデータを用いた緊急インシデント検出手法を提案する。
本稿では,クラウドレポートの信頼性の不確かさをモデル化するための観測理論に基づく計算手法を提案する。
論文 参考訳(メタデータ) (2020-11-10T22:45:03Z) - Learning to Communicate and Correct Pose Errors [75.03747122616605]
本稿では、V2VNetで提案された設定について検討し、近くにある自動運転車が共同で物体検出と動き予測を協調的に行う方法を提案する。
本稿では,コミュニケーションを学習し,潜在的な誤りを推定し,それらの誤りについてコンセンサスを得るための新しいニューラルネットワーク推論フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-10T18:19:40Z) - Showing Your Work Doesn't Always Work [73.63200097493576]
『Show Your Work: Improved Reporting of Experimental Results』では、最高の学習モデルの有効性を報告している。
解析的にそれらの推定器は偏りがあり、エラーを起こしやすい仮定を用いていることを示す。
我々は、偏見のない代替案を導き、統計的シミュレーションから経験的な証拠で主張を裏付ける。
論文 参考訳(メタデータ) (2020-04-28T17:59:01Z) - Leveraging Multi-Source Weak Social Supervision for Early Detection of
Fake News [67.53424807783414]
ソーシャルメディアは、人々が前例のない速度でオンライン活動に参加することを可能にする。
この制限のないアクセスは、誤情報や偽ニュースの拡散を悪化させ、その緩和のために早期に検出されない限り混乱と混乱を引き起こす可能性がある。
ソーシャルエンゲージメントからの弱い信号とともに、限られた量のクリーンデータを活用して、メタラーニングフレームワークでディープニューラルネットワークをトレーニングし、さまざまな弱いインスタンスの品質を推定します。
実世界のデータセットの実験では、提案されたフレームワークは、予測時にユーザーエンゲージメントを使わずに、フェイクニュースを早期に検出するための最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-04-03T18:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。