論文の概要: Auditing Fairness and Imputation Impact in Predictive Analytics for
Higher Education
- arxiv url: http://arxiv.org/abs/2109.07908v1
- Date: Mon, 13 Sep 2021 05:08:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-17 16:26:36.123574
- Title: Auditing Fairness and Imputation Impact in Predictive Analytics for
Higher Education
- Title(参考訳): 高等教育における予測分析における公正さと抑揚の影響
- Authors: Hadis Anahideh, Nazanin Nezami, Denisa G`andara
- Abstract要約: 高等教育における予測分析の導入には2つの大きな障壁がある。
デプロイにおける民主化の欠如と、不平等を悪化させる可能性を挙げる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays, colleges and universities use predictive analytics in a variety of
ways to increase student success rates. Despite the potentials for predictive
analytics, there exist two major barriers to their adoption in higher
education: (a) the lack of democratization in deployment, and (b) the potential
to exacerbate inequalities. Education researchers and policymakers encounter
numerous challenges in deploying predictive modeling in practice. These
challenges present in different steps of modeling including data preparation,
model development, and evaluation. Nevertheless, each of these steps can
introduce additional bias to the system if not appropriately performed. Most
large-scale and nationally representative education data sets suffer from a
significant number of incomplete responses from the research participants.
Missing Values are the frequent latent causes behind many data analysis
challenges. While many education-related studies addressed the challenges of
missing data, little is known about the impact of handling missing values on
the fairness of predictive outcomes in practice.
In this paper, we set out to first assess the disparities in predictive
modeling outcome for college-student success, then investigate the impact of
imputation techniques on the model performance and fairness using a
comprehensive set of common metrics. The comprehensive analysis of a real
large-scale education dataset reveals key insights on the modeling disparity
and how different imputation techniques fundamentally compare to one another in
terms of their impact on the fairness of the student-success predictive
outcome.
- Abstract(参考訳): 現在、大学や大学は様々な方法で予測分析を使って学生の成功率を高めている。
予測分析の可能性にもかかわらず、高等教育導入には2つの大きな障壁がある。
(a) 展開における民主化の欠如、及び
b)不平等を悪化させる可能性
教育研究者や政策立案者は、予測モデリングを実際に展開する上で、多くの課題に遭遇する。
これらの課題は、データ準備、モデル開発、評価を含む様々なモデリングのステップに現れます。
それでもこれらのステップは、適切に実行されていなければ、システムにさらなるバイアスをもたらすことができる。
ほとんどの大規模かつ全国的に代表される教育データセットは、研究参加者からのかなりの数の不完全な回答に苦しむ。
値の欠如は、多くのデータ分析の課題の背後にある頻繁な原因である。
多くの教育関連の研究がデータ不足の課題に対処しているが、実際の予測結果の公平性に対する価値の取り扱いの影響についてはほとんど知られていない。
本稿では,まず,大学学生が成功するための予測モデル結果の相違について評価し,そのモデル性能と公平性に対するインプテーション手法の影響について,共通指標の包括的集合を用いて検討する。
実大規模教育データセットの包括的分析により、モデリングの相違点と異なるインプテーション手法が、学生が成功する予測結果の公平性に与える影響について、相互に根本的な比較を行っていることが明らかになった。
関連論文リスト
- Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。
政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。
本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T08:16:30Z) - Survey on Imbalanced Data, Representation Learning and SEP Forecasting [0.9065034043031668]
ディープラーニング手法は、回帰、分類、予測といった様々なデータ駆動タスクを著しく進歩させてきた。
これらの進歩の多くは、トレーニングデータセットがそれらが含むターゲットに対してバランスが取れているという強い前提に基づいているが、しばしば非現実的な仮定に基づいている。
この不整合は、データが頻繁に不均衡である現実世界の状況と混同され、実用的な応用においてそのようなモデルの有効性を損なう。
我々は、実世界の不均衡をよりよく近似するために、表現学習のような戦略を用いて、バランスの取れたデータ前提から離れる深層学習の成果を提示する。
論文 参考訳(メタデータ) (2023-10-11T15:38:53Z) - Towards Better Modeling with Missing Data: A Contrastive Learning-based
Visual Analytics Perspective [7.577040836988683]
データ不足は機械学習(ML)モデリングの課題となる可能性がある。
現在のアプローチは、特徴計算とラベル予測に分類される。
本研究は、観測データに欠落した値でモデル化するコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T13:16:24Z) - Is Your Model "MADD"? A Novel Metric to Evaluate Algorithmic Fairness
for Predictive Student Models [0.0]
本稿では,モデルの識別行動を分析するために,モデル絶対密度距離(MADD)を提案する。
オンライン授業における学生の成功を予測するための共通課題に対するアプローチを,いくつかの共通予測分類モデルを用いて評価した。
論文 参考訳(メタデータ) (2023-05-24T16:55:49Z) - Evaluating the Fairness of Deep Learning Uncertainty Estimates in
Medical Image Analysis [3.5536769591744557]
深層学習(DL)モデルは多くの医療画像解析タスクで大きな成功を収めている。
しかし、結果として得られたモデルを実際の臨床状況に展開するには、異なるサブ集団間での堅牢性と公平性が必要である。
近年の研究では、人口統計学的サブグループにまたがるDLモデルに有意なバイアスが見られ、モデルに公平性が欠如していることが示されている。
論文 参考訳(メタデータ) (2023-03-06T16:01:30Z) - Training Data Influence Analysis and Estimation: A Survey [25.460140245596918]
トレーニングデータの影響分析と推定に関する総合的な調査を初めて実施する。
我々は、最先端の影響分析手法を分類学に編成する。
本研究では,影響分析をより効果的に活用するための今後の研究の方向性を提案する。
論文 参考訳(メタデータ) (2022-12-09T00:32:46Z) - Systematic Evaluation of Predictive Fairness [60.0947291284978]
バイアス付きデータセットのトレーニングにおけるバイアスの緩和は、重要なオープンな問題である。
複数のタスクにまたがる様々なデバイアス化手法の性能について検討する。
データ条件が相対モデルの性能に強い影響を与えることがわかった。
論文 参考訳(メタデータ) (2022-10-17T05:40:13Z) - Data-Centric Epidemic Forecasting: A Survey [56.99209141838794]
この調査は、様々なデータ駆動の方法論および実践的進歩を掘り下げるものである。
疫学的なデータセットと,流行予測に関連する新しいデータストリームを列挙する。
また,これらの予測システムの現実的な展開において生じる経験や課題についても論じる。
論文 参考訳(メタデータ) (2022-07-19T16:15:11Z) - On the Robustness of Pretraining and Self-Supervision for a Deep
Learning-based Analysis of Diabetic Retinopathy [70.71457102672545]
糖尿病網膜症における訓練方法の違いによる影響を比較検討した。
本稿では,定量的性能,学習した特徴表現の統計,解釈可能性,画像歪みに対する頑健性など,さまざまな側面について検討する。
以上の結果から,ImageNet事前学習モデルでは,画像歪みに対する性能,一般化,堅牢性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T08:32:45Z) - Through the Data Management Lens: Experimental Analysis and Evaluation
of Fair Classification [75.49600684537117]
データ管理研究は、データとアルゴリズムの公平性に関連するトピックに対する存在感と関心が高まっている。
我々は,その正しさ,公平性,効率性,スケーラビリティ,安定性よりも,13の公正な分類アプローチと追加の変種を幅広く分析している。
我々の分析は、異なるメトリクスとハイレベルなアプローチ特性がパフォーマンスの異なる側面に与える影響に関する新しい洞察を強調します。
論文 参考訳(メタデータ) (2021-01-18T22:55:40Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。