論文の概要: Predicting Early Dropout: Calibration and Algorithmic Fairness
Considerations
- arxiv url: http://arxiv.org/abs/2103.09068v1
- Date: Tue, 16 Mar 2021 13:42:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 17:48:16.229498
- Title: Predicting Early Dropout: Calibration and Algorithmic Fairness
Considerations
- Title(参考訳): 早期ドロップアウト予測:キャリブレーションとアルゴリズム的公平性の検討
- Authors: Marzieh Karimi-Haghighi, Carlos Castillo, Davinia Hernandez-Leo,
Veronica Moreno Oliver
- Abstract要約: 本研究では,大学中退のリスクを予測できる機械学習手法を開発した。
予測精度(AUC)および誤差率(一般化偽陽性率、GFPR、一般化偽陰性率、GFNR)の観点から、この方法が一部の敏感群の識別結果につながるかどうかを分析します。
- 参考スコア(独自算出の注目度): 2.7048165023994057
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, the problem of predicting dropout risk in undergraduate studies
is addressed from a perspective of algorithmic fairness. We develop a machine
learning method to predict the risks of university dropout and
underperformance. The objective is to understand if such a system can identify
students at risk while avoiding potential discriminatory biases. When modeling
both risks, we obtain prediction models with an Area Under the ROC Curve (AUC)
of 0.77-0.78 based on the data available at the enrollment time, before the
first year of studies starts. This data includes the students' demographics,
the high school they attended, and their admission (average) grade. Our models
are calibrated: they produce estimated probabilities for each risk, not mere
scores. We analyze if this method leads to discriminatory outcomes for some
sensitive groups in terms of prediction accuracy (AUC) and error rates
(Generalized False Positive Rate, GFPR, or Generalized False Negative Rate,
GFNR). The models exhibit some equity in terms of AUC and GFNR along groups.
The similar GFNR means a similar probability of failing to detect risk for
students who drop out. The disparities in GFPR are addressed through a
mitigation process that does not affect the calibration of the model.
- Abstract(参考訳): 本研究は, アルゴリズム的公平性の観点から, 学部におけるドロップアウトリスクの予測の問題に対処している。
本研究では,大学中退のリスクを予測できる機械学習手法を開発した。
本研究の目的は,リスクのある生徒を識別し,潜在的な差別バイアスを回避することにある。
両リスクをモデル化する際には,初年度より前の入試時間に利用可能なデータに基づいて,ROC曲線(AUC)0.77-0.78のエリアで予測モデルを得る。
このデータには、生徒の人口統計、出席した高校、入試(平均)の成績が含まれている。
私たちのモデルは、単なるスコアではなく、リスクごとに推定確率を生成します。
予測精度 (auc) と誤差率 (一般化偽陽性率, gfpr, または一般化偽陰性率, gfnr) の観点で, この手法が感度の高いグループに対して判別結果をもたらすかどうかを解析した。
これらのモデルは、AUCとGFNRの点でいくつかの株式をグループに沿って示している。
同様のGFNRは、退学した学生のリスクを検出するのに失敗する可能性を示している。
GFPRの格差はモデルの校正に影響を与えない緩和プロセスを通じて対処される。
関連論文リスト
- Mitigating Nonlinear Algorithmic Bias in Binary Classification [0.0]
本稿では,保護属性の非線形なバイアスの検出と緩和に因果モデリングを用いることを提案する。
若年者では「低リスク」と正しく分類される可能性が低いことを示す。
適応因果モデルに基づいて、偏り確率推定を計算し、全体の精度にほとんど影響を与えずに、公正性の向上を示す。
論文 参考訳(メタデータ) (2023-12-09T01:26:22Z) - Distribution-free risk assessment of regression-based machine learning
algorithms [6.507711025292814]
我々は回帰アルゴリズムとモデル予測の周囲に定義された区間内に存在する真のラベルの確率を計算するリスク評価タスクに焦点をあてる。
そこで,本研究では,正のラベルを所定の確率で含むことが保証される予測区間を提供する共形予測手法を用いてリスク評価問題を解決する。
論文 参考訳(メタデータ) (2023-10-05T13:57:24Z) - Diagnosis Uncertain Models For Medical Risk Prediction [80.07192791931533]
本研究は, 患者の診断にはアクセスできない, バイタルサイン, 検査値, 既往歴にアクセス可能な患者リスクモデルについて考察する。
このようなすべての原因のリスクモデルが、診断全体にわたって良い一般化を持つが、予測可能な障害モードを持つことが示される。
患者診断の不確実性から生じるリスク予測の不確実性を明示的にモデル化し,この問題に対する対策を提案する。
論文 参考訳(メタデータ) (2023-06-29T23:36:04Z) - A Generalized Unbiased Risk Estimator for Learning with Augmented
Classes [70.20752731393938]
ラベルなしのデータが与えられた場合、非バイアスリスク推定器(URE)が導出され、理論的保証のあるLACでは最小限にすることができる。
理論的な保証を維持しつつ任意の損失関数を装備できる一般化されたUREを提案する。
論文 参考訳(メタデータ) (2023-06-12T06:52:04Z) - Selecting Models based on the Risk of Damage Caused by Adversarial
Attacks [2.969705152497174]
規制、法的責任、社会的懸念は、安全およびセキュリティクリティカルなアプリケーションにおけるAIの採用に挑戦する。
重要な懸念の1つは、敵が検出されずにモデル予測を操作することで害を引き起こす可能性があることである。
本稿では,敵攻撃による被害の確率をモデル化し,統計的に推定する手法を提案する。
論文 参考訳(メタデータ) (2023-01-28T10:24:38Z) - Evaluating Probabilistic Classifiers: The Triptych [62.997667081978825]
本稿では,予測性能の異なる相補的な側面に焦点をあてた診断グラフィックのトリチチを提案し,研究する。
信頼性図は校正に対処し、受信動作特性(ROC)曲線は識別能力を診断し、マーフィー図は全体的な予測性能と価値を視覚化する。
論文 参考訳(メタデータ) (2023-01-25T19:35:23Z) - Learning from a Biased Sample [3.546358664345473]
本稿では,テスト分布のファミリーで発生する最悪のリスクを最小限に抑える決定ルールの学習方法を提案する。
本研究では,健康調査データからメンタルヘルススコアの予測を行うケーススタディにおいて,提案手法を実証的に検証した。
論文 参考訳(メタデータ) (2022-09-05T04:19:16Z) - A New Approach for Interpretability and Reliability in Clinical Risk
Prediction: Acute Coronary Syndrome Scenario [0.33927193323747895]
我々は、リスクスコアと機械学習モデルの両方の最高の特徴を組み合わせた、新たなリスクアセスメント方法論を作成するつもりです。
提案手法は、標準LRと同一の試験結果を得たが、より優れた解釈性とパーソナライゼーションを提供する。
個人予測の信頼性推定は誤分類率と大きな相関を示した。
論文 参考訳(メタデータ) (2021-10-15T19:33:46Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Individual Calibration with Randomized Forecasting [116.2086707626651]
予測値がランダムに設定された場合,各サンプルのキャリブレーションは回帰設定で可能であることを示す。
我々は、個別の校正を強制する訓練目標を設計し、それをランダム化された回帰関数の訓練に使用する。
論文 参考訳(メタデータ) (2020-06-18T05:53:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。