論文の概要: Equity in Resident Crowdsourcing: Measuring Under-reporting without
Ground Truth Data
- arxiv url: http://arxiv.org/abs/2204.08620v1
- Date: Tue, 19 Apr 2022 02:54:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-20 15:25:12.524944
- Title: Equity in Resident Crowdsourcing: Measuring Under-reporting without
Ground Truth Data
- Title(参考訳): 住民クラウドソーシングのエクイティ:地中真実データなしでのアンダーレポート計測
- Authors: Zhi Liu, Nikhil Garg
- Abstract要約: 外部(プロキシ)の真実データを使わずに(異種)報告率を同定する手法を開発した。
我々は,ニューヨーク市公園再生局の住民報告10万件以上に本手法を適用した。
- 参考スコア(独自算出の注目度): 11.303412095240532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern city governance relies heavily on crowdsourcing (or "co-production")
to identify problems such as downed trees and power-lines. A major concern in
these systems is that residents do not report problems at the same rates,
leading to an inequitable allocation of government resources. However,
measuring such under-reporting is a difficult statistical task, as, almost by
definition, we do not observe incidents that are not reported. Thus,
distinguishing between low reporting rates and low ground-truth incident rates
is challenging. We develop a method to identify (heterogeneous) reporting
rates, without using external (proxy) ground truth data. Our insight is that
rates on $\textit{duplicate}$ reports about the same incident can be leveraged,
to turn the question into a standard Poisson rate estimation task -- even
though the full incident reporting interval is also unobserved. We apply our
method to over 100,000 resident reports made to the New York City Department of
Parks and Recreation, finding that there are substantial spatial and
socio-economic disparities in reporting rates, even after controlling for
incident characteristics.
- Abstract(参考訳): 現代の都市統治は、倒木や電力線といった問題を特定するためにクラウドソーシング(あるいは「共同生産」)に大きく依存している。
これらのシステムにおける主要な懸念は、住民が同じレートで問題を報告しないことであり、政府資源の配分が不平等になってしまうことである。
しかし, 報告されていない事象は, ほぼ定義上観察されていないため, 報告不足の測定は難しい統計課題である。
したがって,低報告率と低信頼度インシデント率の区別は困難である。
外部の(プロキシ)地上真実データを用いずに(異種)報告率を同定する手法を開発した。
我々の洞察では、$\textit{duplicate}$同じインシデントに関するレポートを活用すれば、質問を標準的なPoissonレート推定タスクにすることができます。
本手法は,ニューヨーク市公園・レクリエーション局が実施した10万人以上の住民レポートに適用し,インシデント特性をコントロールした上でも,報告率にかなりの空間的・社会経済的格差があることを見いだした。
関連論文リスト
- How to Train Your Fact Verifier: Knowledge Transfer with Multimodal Open Models [95.44559524735308]
大規模言語またはマルチモーダルモデルに基づく検証は、偽コンテンツや有害コンテンツの拡散を緩和するためのオンラインポリシングメカニズムをスケールアップするために提案されている。
我々は,知識伝達の初期研究を通じて,継続的な更新を行うことなく基礎モデルの性能向上の限界をテストする。
最近の2つのマルチモーダルなファクトチェックベンチマークであるMochegとFakedditの結果は、知識伝達戦略がファクドディットのパフォーマンスを最先端よりも1.7%向上し、Mochegのパフォーマンスを2.9%向上させることができることを示唆している。
論文 参考訳(メタデータ) (2024-06-29T08:39:07Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - A Bayesian Spatial Model to Correct Under-Reporting in Urban
Crowdsourcing [1.850972250657274]
意思決定者は、しばしば報告プロセスを通じてイベントの発生を観察する。
イベントが空間的に相関しているという事実を活用することで、この課題を克服する方法を示す。
論文 参考訳(メタデータ) (2023-12-18T23:40:56Z) - Evaluation of Crowdsourced Data on Unplowed Roads [0.0]
本研究では,クラウドソース・トランスポート・データ・プロバイダであるWazeの新たな未耕起道路データセットを評価する。
報告の81%は雪のイベントに近いものであり、偽陽性は州全体で1日当たり10回程度の割合で発生していた。
ソーシャルメディア上のターゲットメッセージを通じてWazeの未公開道路報告を促進する努力は、参加を増やさなかった。
論文 参考訳(メタデータ) (2023-10-25T15:48:50Z) - Practitioner-Centric Approach for Early Incident Detection Using
Crowdsourced Data for Emergency Services [2.5328886773979375]
Wazeのようなクラウドソーシングプラットフォームは、インシデントを早期に特定する機会を提供する。
クラウドソースデータストリームからのインシデントを検出することは,このようなデータに関連するノイズや不確実性の難しさから難しい。
本稿では,クラウドソーシングデータを用いた実践者中心インシデント検出のための新しい問題定式化と解法を提案する。
論文 参考訳(メタデータ) (2021-12-03T16:51:41Z) - Priority prediction of Asian Hornet sighting report using machine
learning methods [0.0]
アジアのジャイアント・ホーネット(Vespa mandarinia)は、ミツバチのコロニーだけでなく、地元のアピカルチャーにも被害を与えている。
本稿では,機械学習に基づく目撃レポートの優先順位予測手法を提案する。
論文 参考訳(メタデータ) (2021-06-28T07:33:53Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Emergency Incident Detection from Crowdsourced Waze Data using Bayesian
Information Fusion [4.039649741925056]
本稿では,ノイズの多いクラウドソーシングWazeデータを用いた緊急インシデント検出手法を提案する。
本稿では,クラウドレポートの信頼性の不確かさをモデル化するための観測理論に基づく計算手法を提案する。
論文 参考訳(メタデータ) (2020-11-10T22:45:03Z) - Learning to Communicate and Correct Pose Errors [75.03747122616605]
本稿では、V2VNetで提案された設定について検討し、近くにある自動運転車が共同で物体検出と動き予測を協調的に行う方法を提案する。
本稿では,コミュニケーションを学習し,潜在的な誤りを推定し,それらの誤りについてコンセンサスを得るための新しいニューラルネットワーク推論フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-10T18:19:40Z) - Showing Your Work Doesn't Always Work [73.63200097493576]
『Show Your Work: Improved Reporting of Experimental Results』では、最高の学習モデルの有効性を報告している。
解析的にそれらの推定器は偏りがあり、エラーを起こしやすい仮定を用いていることを示す。
我々は、偏見のない代替案を導き、統計的シミュレーションから経験的な証拠で主張を裏付ける。
論文 参考訳(メタデータ) (2020-04-28T17:59:01Z) - Leveraging Multi-Source Weak Social Supervision for Early Detection of
Fake News [67.53424807783414]
ソーシャルメディアは、人々が前例のない速度でオンライン活動に参加することを可能にする。
この制限のないアクセスは、誤情報や偽ニュースの拡散を悪化させ、その緩和のために早期に検出されない限り混乱と混乱を引き起こす可能性がある。
ソーシャルエンゲージメントからの弱い信号とともに、限られた量のクリーンデータを活用して、メタラーニングフレームワークでディープニューラルネットワークをトレーニングし、さまざまな弱いインスタンスの品質を推定します。
実世界のデータセットの実験では、提案されたフレームワークは、予測時にユーザーエンゲージメントを使わずに、フェイクニュースを早期に検出するための最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-04-03T18:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。