論文の概要: Adversarial Debiasing for Unbiased Parameter Recovery
- arxiv url: http://arxiv.org/abs/2502.12323v1
- Date: Mon, 17 Feb 2025 20:54:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-19 14:08:30.415091
- Title: Adversarial Debiasing for Unbiased Parameter Recovery
- Title(参考訳): 無バイアスパラメータ回復のための逆行性脱バイアス法
- Authors: Luke C Sanford, Megan Ayers, Matthew Gordon, Eliana Stone,
- Abstract要約: 機械学習モデルからの予測誤差が回帰係数の推定に偏りをもたらすことを示す。
本稿では, バイアス検出テストを提案し, 予測を非バイアス化するために, 逆方向の機械学習アルゴリズムを用いることを実証する。
アフリカにおける森林被覆に関する地上の真実と衛星データを用いたシミュレーションおよび実証演習を行った。
- 参考スコア(独自算出の注目度): 0.8749675983608172
- License:
- Abstract: Advances in machine learning and the increasing availability of high-dimensional data have led to the proliferation of social science research that uses the predictions of machine learning models as proxies for measures of human activity or environmental outcomes. However, prediction errors from machine learning models can lead to bias in the estimates of regression coefficients. In this paper, we show how this bias can arise, propose a test for detecting bias, and demonstrate the use of an adversarial machine learning algorithm in order to de-bias predictions. These methods are applicable to any setting where machine-learned predictions are the dependent variable in a regression. We conduct simulations and empirical exercises using ground truth and satellite data on forest cover in Africa. Using the predictions from a naive machine learning model leads to biased parameter estimates, while the predictions from the adversarial model recover the true coefficients.
- Abstract(参考訳): 機械学習の進歩と高次元データの利用の増加は、人間の活動や環境効果の指標として機械学習モデルの予測を利用する社会科学研究の拡散につながっている。
しかし、機械学習モデルからの予測誤差は回帰係数の推定に偏りをもたらす可能性がある。
本稿では、このバイアスがどのように発生しうるかを示し、バイアスを検出するためのテストを提案し、予測を非バイアス化するために対向機械学習アルゴリズムの使用を実証する。
これらの手法は、機械学習予測が回帰の依存変数である任意の設定に適用できる。
アフリカにおける森林被覆に関する地上の真実と衛星データを用いたシミュレーションおよび実証演習を行った。
ナイーブ機械学習モデルからの予測を使用することで、偏りのあるパラメータ推定が得られ、一方、逆数モデルからの予測は真の係数を回復する。
関連論文リスト
- Prediction-Powered Inference with Imputed Covariates and Nonuniform Sampling [20.078602767179355]
機械学習予測におけるエラーを適切に説明できないことは、標準的な統計手順を無効にする。
我々は、完全なデータが一様でないサンプル(重み付け、成層化、クラスタ化)である場合に適用されるブートストラップの信頼区間と、任意の機能のサブセットが暗示される設定を紹介する。
これらの信頼区間は、機械学習モデルの品質を仮定せずに有効であり、機械学習予測を使用しない手法によって得られる区間よりも広くないことを示す。
論文 参考訳(メタデータ) (2025-01-30T18:46:43Z) - Challenges learning from imbalanced data using tree-based models: Prevalence estimates systematically depend on hyperparameters and can be upwardly biased [0.0]
不均衡二項分類問題は、多くの研究分野において発生する。
モデルのトレーニングのための(より)バランスのとれたデータセットを作成するために、多数派のクラスをサブサンプルするのが一般的です。
これは、モデルが新しいデータと同じデータ生成プロセスに従わないデータセットから学習するため、モデルの予測をバイアスする。
論文 参考訳(メタデータ) (2024-12-17T19:38:29Z) - A Systematic Bias of Machine Learning Regression Models and Its Correction: an Application to Imaging-based Brain Age Prediction [2.4894581801802227]
継続的成果のための機械学習モデルは、しばしば体系的にバイアスのある予測をもたらす。
大きな評価結果の予測は負のバイアスを受ける傾向がある(実際の値の過小評価)
小さく評価された結果のものは、正にバイアス(実際の値を過大評価する)される。
論文 参考訳(メタデータ) (2024-05-24T21:34:16Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - On the Relation between Prediction and Imputation Accuracy under Missing
Covariates [0.0]
近年の研究では、計算のための現代の機械学習アルゴリズムの利用傾向が増している。
近年の研究では、計算のための現代の機械学習アルゴリズムの利用傾向が増している。
論文 参考訳(メタデータ) (2021-12-09T23:30:44Z) - Hessian-based toolbox for reliable and interpretable machine learning in
physics [58.720142291102135]
本稿では,モデルアーキテクチャの解釈可能性と信頼性,外挿を行うためのツールボックスを提案する。
与えられたテストポイントでの予測に対する入力データの影響、モデル予測の不確実性の推定、およびモデル予測の不可知スコアを提供する。
我々の研究は、物理学やより一般的には科学に適用されたMLにおける解釈可能性と信頼性の方法の体系的利用への道を開く。
論文 参考訳(メタデータ) (2021-08-04T16:32:59Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Counterfactual Predictions under Runtime Confounding [74.90756694584839]
本研究は, 過去のデータからすべての関連要因を抽出した環境で, 事実予測タスクについて検討する。
本稿では,この環境下での対実予測モデル学習のための2次ロバスト手法を提案する。
論文 参考訳(メタデータ) (2020-06-30T15:49:05Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。