論文の概要: Why Do Students Drop Out? University Dropout Prediction and Associated
Factor Analysis Using Machine Learning Techniques
- arxiv url: http://arxiv.org/abs/2310.10987v1
- Date: Tue, 17 Oct 2023 04:20:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 17:33:14.061334
- Title: Why Do Students Drop Out? University Dropout Prediction and Associated
Factor Analysis Using Machine Learning Techniques
- Title(参考訳): なぜ学生は退学するの?
機械学習を用いた大学ドロップアウト予測と関連する因子分析
- Authors: Sean Kim and Eliot Yoo and Samuel Kim
- Abstract要約: 本研究では,学術,人口統計,社会経済,マクロ経済データ型を用いた大学ドロップアウト予測について検討した。
モデルの性能に最も影響を及ぼすデータ型は学術データであることが判明した。
予備的な結果は、データ型とドロップアウトステータスの間に相関が存在することを示している。
- 参考スコア(独自算出の注目度): 0.5042480200195721
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graduation and dropout rates have always been a serious consideration for
educational institutions and students. High dropout rates negatively impact
both the lives of individual students and institutions. To address this
problem, this study examined university dropout prediction using academic,
demographic, socioeconomic, and macroeconomic data types. Additionally, we
performed associated factor analysis to analyze which type of data would be
most influential on the performance of machine learning models in predicting
graduation and dropout status. These features were used to train four binary
classifiers to determine if students would graduate or drop out. The overall
performance of the classifiers in predicting dropout status had an average
ROC-AUC score of 0.935. The data type most influential to the model performance
was found to be academic data, with the average ROC-AUC score dropping from
0.935 to 0.811 when excluding all academic-related features from the data set.
Preliminary results indicate that a correlation does exist between data types
and dropout status.
- Abstract(参考訳): グラデーションとドロップアウト率は、教育機関や学生にとって常に深刻な考慮事項である。
高いドロップアウト率は、個々の学生と機関の生活に悪影響を及ぼす。
そこで本研究では,学術,人口統計,社会経済,マクロ経済データを用いた大学退学予測について検討した。
さらに, 卒業と退学状態の予測において, 機械学習モデルの性能に最も影響を及ぼすデータの種類を分析するために, 関連する因子分析を行った。
これらの特徴は、学生が卒業するか退学するかを決定するために、4つのバイナリ分類器を訓練するために使用された。
ドロップアウト状態の予測における分類器の総合的な性能は、平均ROC-AUCスコア0.935であった。
モデルの性能に最も影響を及ぼすデータ型は学術データであり, 平均ROC-AUCスコアは, データセットからすべての学術的特徴を除くと0.935から0.811に低下することがわかった。
予備結果は、データ型とドロップアウト状態の間に相関があることを示している。
関連論文リスト
- Improving On-Time Undergraduate Graduation Rate For Undergraduate Students Using Predictive Analytics [0.0]
プエルトリコの大学における在学期間の卒業率は、アメリカ合衆国本土よりも大幅に低い。
本研究は,学生の学習開始時期を正確に把握し,時間通りに卒業しないリスクを負う予測モデルの構築を目的とする。
論文 参考訳(メタデータ) (2024-05-02T22:33:42Z) - Temporal and Between-Group Variability in College Dropout Prediction [0.0]
本研究では,機械学習モデルの寄与要因と予測性能を体系的に評価する。
最終年度末の降雨予測は,ランダムフォレストモデルによる入園時よりも20%高い値を示した。
学生集団間の多様性に関して、大学GPAは、伝統的に不利な背景を持つ学生にとって、仲間よりも予測的価値が高い。
論文 参考訳(メタデータ) (2024-01-12T10:43:55Z) - Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals [91.59906995214209]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Is Your Model "MADD"? A Novel Metric to Evaluate Algorithmic Fairness
for Predictive Student Models [0.0]
本稿では,モデルの識別行動を分析するために,モデル絶対密度距離(MADD)を提案する。
オンライン授業における学生の成功を予測するための共通課題に対するアプローチを,いくつかの共通予測分類モデルを用いて評価した。
論文 参考訳(メタデータ) (2023-05-24T16:55:49Z) - Evaluating Splitting Approaches in the Context of Student Dropout
Prediction [0.0]
本研究は,学習・テストセットを作成するために,学術データを分割・利用するための戦略について研究する。
この研究は、時間的分割と学生の漸進的な学歴の選択が相まって、問題の最良の戦略が導かれることを示唆している。
論文 参考訳(メタデータ) (2023-05-15T12:30:11Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Predicting Early Dropout: Calibration and Algorithmic Fairness
Considerations [2.7048165023994057]
本研究では,大学中退のリスクを予測できる機械学習手法を開発した。
予測精度(AUC)および誤差率(一般化偽陽性率、GFPR、一般化偽陰性率、GFNR)の観点から、この方法が一部の敏感群の識別結果につながるかどうかを分析します。
論文 参考訳(メタデータ) (2021-03-16T13:42:16Z) - Advanced Dropout: A Model-free Methodology for Bayesian Dropout
Optimization [62.8384110757689]
ディープニューラルネットワーク(DNN)の現実的応用において、ユビキタスなオーバーフィッティングが存在する
先進的なドロップアウト手法は、パラメトリック先行でモデルフリーで容易に実装された分布を適用し、ドロップアウト率を適応的に調整する。
7つのコンピュータビジョンデータセットにおける9つのドロップアウト手法に対する高度なドロップアウトの有効性を評価する。
論文 参考訳(メタデータ) (2020-10-11T13:19:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。