論文の概要: Can Strategic Data Collection Improve the Performance of Poverty
Prediction Models?
- arxiv url: http://arxiv.org/abs/2211.08735v1
- Date: Wed, 16 Nov 2022 07:50:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 15:57:16.104932
- Title: Can Strategic Data Collection Improve the Performance of Poverty
Prediction Models?
- Title(参考訳): 戦略データ収集は貧困予測モデルの性能を向上させるか?
- Authors: Satej Soman, Emily Aiken, Esther Rolf, and Joshua Blumenstock
- Abstract要約: 地平データ収集のための適応型サンプリング手法が貧困予測モデルの性能を向上させるかどうかを検証した。
これらのアクティブな学習手法はいずれも一様ランダムサンプリングよりも改善されていない。
これらの結果が、機械学習に基づく貧困の推定を洗練するための将来の取り組みにどのように役立つかについて議論する。
- 参考スコア(独自算出の注目度): 4.444335418188173
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning-based estimates of poverty and wealth are increasingly being
used to guide the targeting of humanitarian aid and the allocation of social
assistance. However, the ground truth labels used to train these models are
typically borrowed from existing surveys that were designed to produce national
statistics -- not to train machine learning models. Here, we test whether
adaptive sampling strategies for ground truth data collection can improve the
performance of poverty prediction models. Through simulations, we compare the
status quo sampling strategies (uniform at random and stratified random
sampling) to alternatives that prioritize acquiring training data based on
model uncertainty or model performance on sub-populations. Perhaps
surprisingly, we find that none of these active learning methods improve over
uniform-at-random sampling. We discuss how these results can help shape future
efforts to refine machine learning-based estimates of poverty.
- Abstract(参考訳): 機械学習に基づく貧困と富の推定は、人道支援のターゲティングと社会援助の割り当てを導くためにますます利用されている。
しかし、これらのモデルのトレーニングに使用される基底的真理ラベルは、通常、機械学習モデルのトレーニングではなく、国家統計を生成するために設計された既存の調査から借用されている。
ここでは、地平データ収集のための適応的サンプリング戦略が貧困予測モデルの性能を向上させるかどうかを検証する。
シミュレーションにより,モデル不確実性に基づくトレーニングデータ獲得を優先する代替手法や,サブ集団におけるモデル性能を優先する手法と,現状のサンプリング戦略(ランダム・階層化ランダムサンプリング)を比較した。
意外なことに、これらのアクティブな学習手法は、ランダムな一様サンプリングよりも改善されていない。
これらの結果は、機械学習による貧困の推定を洗練するための将来の取り組みにどのように役立つかについて議論する。
関連論文リスト
- Model-Free Active Exploration in Reinforcement Learning [53.786439742572995]
強化学習における探索問題について検討し,新しいモデルフリーソリューションを提案する。
我々の戦略は、最先端の探査アプローチよりも高速に効率的な政策を特定できる。
論文 参考訳(メタデータ) (2024-06-30T19:00:49Z) - Towards Learning Stochastic Population Models by Gradient Descent [0.0]
パラメータと構造を同時に推定することで,最適化手法に大きな課題が生じることを示す。
モデルの正確な推定を実証するが、擬似的、解釈可能なモデルの推論を強制することは、難易度を劇的に高める。
論文 参考訳(メタデータ) (2024-04-10T14:38:58Z) - A step towards the integration of machine learning and small area
estimation [0.0]
本稿では,機械学習アルゴリズムがサポートする予測器を提案する。
仮定モデルからわずかに逸脱しただけで、この場合も提案が良い代替手段であることを示す。
さらに,機械学習予測器の精度推定手法を提案し,従来の手法との比較を行った。
論文 参考訳(メタデータ) (2024-02-12T09:43:17Z) - Secrets of RLHF in Large Language Models Part II: Reward Modeling [134.97964938009588]
本稿では,データセットにおける不正確で曖昧な嗜好の影響を軽減するために,一連の新しい手法を紹介する。
また、選択された応答と拒否された応答を区別する報酬モデルの有用性を高めるために、対照的な学習を導入する。
論文 参考訳(メタデータ) (2024-01-11T17:56:59Z) - Improving Heterogeneous Model Reuse by Density Estimation [105.97036205113258]
本稿では,異なる参加者の個人データを用いてモデルを学習することを目的とした多人数学習について検討する。
モデルの再利用は、各パーティーのためにローカルモデルがトレーニングされていると仮定して、マルチパーティの学習にとって有望なソリューションである。
論文 参考訳(メタデータ) (2023-05-23T09:46:54Z) - Canary in a Coalmine: Better Membership Inference with Ensembled
Adversarial Queries [53.222218035435006]
私たちは、差別的で多様なクエリを最適化するために、逆ツールを使用します。
我々の改善は既存の方法よりもはるかに正確な会員推定を実現している。
論文 参考訳(メタデータ) (2022-10-19T17:46:50Z) - The Lifecycle of a Statistical Model: Model Failure Detection,
Identification, and Refitting [26.351782287953267]
モデル性能が低下し始めた共変量空間(サブポピュレーション)の領域を検出し同定するためのツールと理論を開発した。
実世界の3つのデータセットを用いて実験結果を示す。
我々はこれらの実験結果を補足し、我々の手法が異常なサブ集団の回復に最適であることを示す理論で補足する。
論文 参考訳(メタデータ) (2022-02-08T22:02:31Z) - On the model-based stochastic value gradient for continuous
reinforcement learning [50.085645237597056]
モデルベースエージェントは,サンプル効率と最終報酬の両方の観点から,最先端のモデルフリーエージェントより優れていることを示す。
以上の結果から,モデルに基づく政策評価がより注目に値することが示唆された。
論文 参考訳(メタデータ) (2020-08-28T17:58:29Z) - Learning Diverse Representations for Fast Adaptation to Distribution
Shift [78.83747601814669]
本稿では,複数のモデルを学習する手法を提案する。
分散シフトへの迅速な適応を促進するフレームワークの能力を実証する。
論文 参考訳(メタデータ) (2020-06-12T12:23:50Z) - Modeling Survival in model-based Reinforcement Learning [0.0]
この研究は、エージェントの目的が生き残ることの事例を議論することで生存の概念を提示する。
端末状態を避けることを学ぶ報奨関数近似の代用モデルを導入する。
終端状態に注目することは、少数の状態空間として、トレーニングの労力を大幅に削減する。
論文 参考訳(メタデータ) (2020-04-18T15:49:11Z) - Design-unbiased statistical learning in survey sampling [0.0]
そこで我々は,Rao-Blackwell法をサブサンプルとして提案し,正確な設計不偏性推定のための統計的学習理論を開発した。
我々のアプローチは、統計科学の古典的アイデアと、急速に成長する機械学習の分野を生かしている。
論文 参考訳(メタデータ) (2020-03-25T14:27:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。