論文の概要: On the limits of algorithmic prediction across the globe
- arxiv url: http://arxiv.org/abs/2103.15212v1
- Date: Sun, 28 Mar 2021 19:53:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-31 07:30:19.760548
- Title: On the limits of algorithmic prediction across the globe
- Title(参考訳): 地球におけるアルゴリズム予測の限界について
- Authors: Xingyu Li, Difan Song, Miaozhe Han, Yu Zhang, Rene F. Kizilcec
- Abstract要約: 米国のデータに基づいてトレーニングされた最先端の機械学習モデルは、高い精度で達成を予測でき、同等の精度で他の先進国に一般化できる。
同じモデルを全国データでトレーニングすると、各国で高い精度が得られ、ローカルデータ収集の価値が強調される。
- 参考スコア(独自算出の注目度): 4.392517231156947
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The impact of predictive algorithms on people's lives and livelihoods has
been noted in medicine, criminal justice, finance, hiring and admissions. Most
of these algorithms are developed using data and human capital from highly
developed nations. We tested how well predictive models of human behavior
trained in a developed country generalize to people in less developed countries
by modeling global variation in 200 predictors of academic achievement on
nationally representative student data for 65 countries. Here we show that
state-of-the-art machine learning models trained on data from the United States
can predict achievement with high accuracy and generalize to other developed
countries with comparable accuracy. However, accuracy drops linearly with
national development due to global variation in the importance of different
achievement predictors, providing a useful heuristic for policymakers. Training
the same model on national data yields high accuracy in every country, which
highlights the value of local data collection.
- Abstract(参考訳): 予測アルゴリズムが人々の生活や生活に与える影響は、医学、刑事司法、金融、雇用、入場などで指摘されている。
これらのアルゴリズムの多くは高度に発達した国々のデータと人的資本を用いて開発されている。
先進国で訓練された人間の行動の予測モデルが、65カ国の全国代表学生データに基づく200人の学歴達成予測者のグローバル変動をモデル化し、先進国の人々に広く普及するかどうかを検証した。
ここでは、米国のデータに基づいてトレーニングされた最先端の機械学習モデルが、高い精度で達成を予測でき、同等の精度で他の先進国に一般化できることを示す。
しかし、様々な達成予測者の重要性のグローバル変動により、国家発展とともに精度は直線的に低下し、政策立案者にとって有用なヒューリスティックとなる。
同じモデルを全国データでトレーニングすると、各国で高い精度が得られ、ローカルデータ収集の価値が強調される。
関連論文リスト
- Evaluating Pre-Training Bias on Severe Acute Respiratory Syndrome Dataset [0.0]
この研究は、OpenDataSUSの重症急性呼吸症候群データセットを使用して、3つのトレーニング済みバイアスメトリクスを可視化する。
目的は、異なる領域のバイアスを比較し、保護された属性に注目し、モデルのパフォーマンスとメトリック値を比較することである。
論文 参考訳(メタデータ) (2024-08-27T20:49:11Z) - A Fair Post-Processing Method based on the MADD Metric for Predictive Student Models [1.055551340663609]
予測的学生モデルにおけるアルゴリズム的公正性を評価するために,新しい尺度が開発された。
本稿では,適切な予測モデルの結果の正確性を保ちつつ,公平性を向上することを目的とした後処理手法を提案する。
我々は、シミュレーションと実世界の教育データを用いて、オンラインコースにおける学生の成功を予測するタスクについて実験を行った。
論文 参考訳(メタデータ) (2024-07-07T14:53:41Z) - Mesh-Wise Prediction of Demographic Composition from Satellite Images
Using Multi-Head Convolutional Neural Network [0.0]
本稿では,事前学習したResNet50からの伝達学習を用いたマルチヘッド畳み込みニューラルネットワークモデルを提案する。
Landsat-8/OLIとSuomi NPP/VIIRS-DNSの衛星画像の入力と人口統計をラベルとして扱う。
トレーニングされたモデルは、すべての人口構成群に対して、少なくとも0.8914 in $textR2$の試験スコアを持つテストデータセット上で実行され、2022年の非センセーション年として、推定された人口構成が生成され、可視化された。
論文 参考訳(メタデータ) (2023-08-25T15:41:05Z) - Learning for Counterfactual Fairness from Observational Data [62.43249746968616]
公正な機械学習は、人種、性別、年齢などの特定の保護された(感受性のある)属性によって記述されるある種のサブグループに対して、学習モデルのバイアスを取り除くことを目的としている。
カウンターファクトフェアネスを達成するための既存の手法の前提条件は、データに対する因果モデルの事前の人間の知識である。
本研究では,新しいフレームワークCLAIREを提案することにより,因果関係を付与せずに観測データから対実的に公正な予測を行う問題に対処する。
論文 参考訳(メタデータ) (2023-07-17T04:08:29Z) - Predictive World Models from Real-World Partial Observations [66.80340484148931]
本研究では,現実の道路環境に対する確率論的予測世界モデル学習のためのフレームワークを提案する。
従来の手法では、学習のための基礎的真理として完全状態を必要とするが、HVAEが部分的に観察された状態のみから完全状態を予測することを学べる新しい逐次訓練法を提案する。
論文 参考訳(メタデータ) (2023-01-12T02:07:26Z) - Generalization and Personalization of Mobile Sensing-Based Mood
Inference Models: An Analysis of College Students in Eight Countries [8.218081835111912]
8か国678人の参加者から329万件の自己申告を行ったモバイルセンシングデータセットを収集した。
国別(大陸内での訓練・試験)、大陸別(大陸内での訓練・試験)、国別(訓練データでは見られない国で試験)、多国間(複数の国で訓練・試験)のアプローチを評価した。
論文 参考訳(メタデータ) (2022-11-06T02:26:52Z) - Strict baselines for Covid-19 forecasting and ML perspective for USA and
Russia [105.54048699217668]
Covid-19は、2年間にわたって蓄積されたデータセットを収集し、予測分析に使用できるようにする。
本研究は、米国とロシアの2カ国の地域データに基づいて、Covid-19の拡散のダイナミクスを予測するための様々な種類の方法に関する一貫した研究結果である。
論文 参考訳(メタデータ) (2022-07-15T18:21:36Z) - Forecasting Future World Events with Neural Networks [68.43460909545063]
Autocastは数千の予測質問と付随するニュースコーパスを含むデータセットである。
ニュースコーパスは日付によって整理され、人間が過去の予測を行った条件を正確にシミュレートすることができる。
予測タスクで言語モデルをテストし、パフォーマンスが人間専門家のベースラインよりはるかに低いことを確認します。
論文 参考訳(メタデータ) (2022-06-30T17:59:14Z) - Understanding peacefulness through the world news [1.6975704972827304]
我々は,GDELT(Global Data on Events, Location, and Tone)デジタルニュースデータベースから抽出した情報を利用して,GPI(Global Peace Index)を通して平和性を捉える。
予測機械学習モデルを用いることで,GDELTからのニュースメディアの注目度を,GPIを月次レベルで測定するためのプロキシとして利用できることを示す。
論文 参考訳(メタデータ) (2021-06-01T08:24:57Z) - Representative & Fair Synthetic Data [68.8204255655161]
公平性制約を自己監督学習プロセスに組み込むためのフレームワークを提示する。
私たちはuci成人国勢調査データセットの代表者および公正版を作成します。
我々は、代表的かつ公正な合成データを将来有望なビルディングブロックとみなし、歴史的世界ではなく、私たちが生きようとしている世界についてアルゴリズムを教える。
論文 参考訳(メタデータ) (2021-04-07T09:19:46Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。