論文の概要: Quantifying Spatial Under-reporting Disparities in Resident
Crowdsourcing
- arxiv url: http://arxiv.org/abs/2204.08620v2
- Date: Tue, 28 Mar 2023 17:24:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 20:04:30.791017
- Title: Quantifying Spatial Under-reporting Disparities in Resident
Crowdsourcing
- Title(参考訳): クラウドソーシングにおける空間的未報告格差の定量化
- Authors: Zhi Liu, Nikhil Garg
- Abstract要約: 本研究では,外部の地中真実データを用いずに(異質な)報告率を同定する手法を開発した。
我々は,ニューヨーク市公園再生局の住民10万人以上の報告に,シカゴ交通省と水道管理省の90万人以上の報告に本手法を適用した。
- 参考スコア(独自算出の注目度): 11.303412095240532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern city governance relies heavily on crowdsourcing ("co-production") to
identify problems such as downed trees and power lines. A major concern is that
residents do not report problems at the same rates, with reporting
heterogeneity directly translating to downstream disparities in how quickly
incidents can be addressed. Measuring such under-reporting is a difficult
statistical task, as, by definition, we do not observe incidents that are not
reported or when reported incidents first occurred. Thus, low reporting rates
and low ground-truth incident rates cannot be naively distinguished. We develop
a method to identify (heterogeneous) reporting rates, without using external
ground truth data. Our insight is that rates on $\textit{duplicate}$ reports
about the same incident can be leveraged to disambiguate whether an incident
has occurred with its reporting rate once it has occurred. Using this idea, we
reduce the question to a standard Poisson rate estimation task -- even though
the full incident reporting interval is also unobserved.
We apply our method to over 100,000 resident reports made to the New York
City Department of Parks and Recreation and to over 900,000 reports made to the
Chicago Department of Transportation and Department of Water Management,
finding that there are substantial spatial disparities in reporting rates even
after controlling for incident characteristics -- some neighborhoods report
three times as quickly as do others. These spatial disparities correspond to
socio-economic characteristics: in NYC, higher population density, fraction of
people with college degrees, income, and fraction of population that is White
all positively correlate with reporting rates.
- Abstract(参考訳): 現代の都市統治は、倒木や電力線といった問題を特定するためにクラウドソーシング(共同生産)に大きく依存している。
主な懸念は、住民が同じ率で問題を報告しないことであり、インシデントへの対処の迅速さにおいて、下流の格差に直結する異質性を報告していることである。
このようなアンダーレポートの測定は、定義上、報告されていないインシデントや報告されたインシデントの発生を観測しないため、難しい統計的タスクである。
したがって、報告率の低さと地中インシデント率の低さは、内在的に区別できない。
外部の事実データを用いずに(ヘテロジェンシーな)報告率を識別する手法を開発した。
我々の洞察では、同じインシデントに関する$\textit{duplicate}$のレポートは、インシデントが発生した時にその報告レートで発生したかどうかを曖昧にするために利用することができる。
Using this idea, we reduce the question to a standard Poisson rate estimation task -- even though the full incident reporting interval is also unobserved. We apply our method to over 100,000 resident reports made to the New York City Department of Parks and Recreation and to over 900,000 reports made to the Chicago Department of Transportation and Department of Water Management, finding that there are substantial spatial disparities in reporting rates even after controlling for incident characteristics -- some neighborhoods report three times as quickly as do others.
これらの空間的格差は社会経済的特徴に対応しており、ニューヨーク市では人口密度が高く、大学の学位を持つ人の比率、収入、人口の比率は報告率と正の相関がある。
関連論文リスト
- How to Train Your Fact Verifier: Knowledge Transfer with Multimodal Open Models [95.44559524735308]
大規模言語またはマルチモーダルモデルに基づく検証は、偽コンテンツや有害コンテンツの拡散を緩和するためのオンラインポリシングメカニズムをスケールアップするために提案されている。
我々は,知識伝達の初期研究を通じて,継続的な更新を行うことなく基礎モデルの性能向上の限界をテストする。
最近の2つのマルチモーダルなファクトチェックベンチマークであるMochegとFakedditの結果は、知識伝達戦略がファクドディットのパフォーマンスを最先端よりも1.7%向上し、Mochegのパフォーマンスを2.9%向上させることができることを示唆している。
論文 参考訳(メタデータ) (2024-06-29T08:39:07Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - A Bayesian Spatial Model to Correct Under-Reporting in Urban
Crowdsourcing [1.850972250657274]
意思決定者は、しばしば報告プロセスを通じてイベントの発生を観察する。
イベントが空間的に相関しているという事実を活用することで、この課題を克服する方法を示す。
論文 参考訳(メタデータ) (2023-12-18T23:40:56Z) - Evaluation of Crowdsourced Data on Unplowed Roads [0.0]
本研究では,クラウドソース・トランスポート・データ・プロバイダであるWazeの新たな未耕起道路データセットを評価する。
報告の81%は雪のイベントに近いものであり、偽陽性は州全体で1日当たり10回程度の割合で発生していた。
ソーシャルメディア上のターゲットメッセージを通じてWazeの未公開道路報告を促進する努力は、参加を増やさなかった。
論文 参考訳(メタデータ) (2023-10-25T15:48:50Z) - Practitioner-Centric Approach for Early Incident Detection Using
Crowdsourced Data for Emergency Services [2.5328886773979375]
Wazeのようなクラウドソーシングプラットフォームは、インシデントを早期に特定する機会を提供する。
クラウドソースデータストリームからのインシデントを検出することは,このようなデータに関連するノイズや不確実性の難しさから難しい。
本稿では,クラウドソーシングデータを用いた実践者中心インシデント検出のための新しい問題定式化と解法を提案する。
論文 参考訳(メタデータ) (2021-12-03T16:51:41Z) - Priority prediction of Asian Hornet sighting report using machine
learning methods [0.0]
アジアのジャイアント・ホーネット(Vespa mandarinia)は、ミツバチのコロニーだけでなく、地元のアピカルチャーにも被害を与えている。
本稿では,機械学習に基づく目撃レポートの優先順位予測手法を提案する。
論文 参考訳(メタデータ) (2021-06-28T07:33:53Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Emergency Incident Detection from Crowdsourced Waze Data using Bayesian
Information Fusion [4.039649741925056]
本稿では,ノイズの多いクラウドソーシングWazeデータを用いた緊急インシデント検出手法を提案する。
本稿では,クラウドレポートの信頼性の不確かさをモデル化するための観測理論に基づく計算手法を提案する。
論文 参考訳(メタデータ) (2020-11-10T22:45:03Z) - Learning to Communicate and Correct Pose Errors [75.03747122616605]
本稿では、V2VNetで提案された設定について検討し、近くにある自動運転車が共同で物体検出と動き予測を協調的に行う方法を提案する。
本稿では,コミュニケーションを学習し,潜在的な誤りを推定し,それらの誤りについてコンセンサスを得るための新しいニューラルネットワーク推論フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-10T18:19:40Z) - Showing Your Work Doesn't Always Work [73.63200097493576]
『Show Your Work: Improved Reporting of Experimental Results』では、最高の学習モデルの有効性を報告している。
解析的にそれらの推定器は偏りがあり、エラーを起こしやすい仮定を用いていることを示す。
我々は、偏見のない代替案を導き、統計的シミュレーションから経験的な証拠で主張を裏付ける。
論文 参考訳(メタデータ) (2020-04-28T17:59:01Z) - Leveraging Multi-Source Weak Social Supervision for Early Detection of
Fake News [67.53424807783414]
ソーシャルメディアは、人々が前例のない速度でオンライン活動に参加することを可能にする。
この制限のないアクセスは、誤情報や偽ニュースの拡散を悪化させ、その緩和のために早期に検出されない限り混乱と混乱を引き起こす可能性がある。
ソーシャルエンゲージメントからの弱い信号とともに、限られた量のクリーンデータを活用して、メタラーニングフレームワークでディープニューラルネットワークをトレーニングし、さまざまな弱いインスタンスの品質を推定します。
実世界のデータセットの実験では、提案されたフレームワークは、予測時にユーザーエンゲージメントを使わずに、フェイクニュースを早期に検出するための最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-04-03T18:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。