論文の概要: Predicting First Year Dropout from Pre Enrolment Motivation Statements Using Text Mining
- arxiv url: http://arxiv.org/abs/2509.16224v1
- Date: Fri, 12 Sep 2025 09:32:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-28 15:30:14.337905
- Title: Predicting First Year Dropout from Pre Enrolment Motivation Statements Using Text Mining
- Title(参考訳): テキストマイニングによるプレエンロメントモチベーションステートメントからの初年度降雨予測
- Authors: K. F. B. Soppe, A. Bagheri, S. Nadi, I. G. Klugkist, T. Wubbels, L. D. N. V. Wijngaards-De Meij,
- Abstract要約: 高校のGPAはドロップアウトの強い予測因子であるが、ドロップアウトのばらつきについては説明されていない。
本研究は,テキストマイニングによる大学退学予測に焦点を当てた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Preventing student dropout is a major challenge in higher education and it is difficult to predict prior to enrolment which students are likely to drop out and which students are likely to succeed. High School GPA is a strong predictor of dropout, but much variance in dropout remains to be explained. This study focused on predicting university dropout by using text mining techniques with the aim of exhuming information contained in motivation statements written by students. By combining text data with classic predictors of dropout in the form of student characteristics, we attempt to enhance the available set of predictive student characteristics. Our dataset consisted of 7,060 motivation statements of students enrolling in a non-selective bachelor at a Dutch university in 2014 and 2015. Support Vector Machines were trained on 75 percent of the data and several models were estimated on the test data. We used various combinations of student characteristics and text, such as TFiDF, topic modelling, LIWC dictionary. Results showed that, although the combination of text and student characteristics did not improve the prediction of dropout, text analysis alone predicted dropout similarly well as a set of student characteristics. Suggestions for future research are provided.
- Abstract(参考訳): 学生の退学防止は高等教育における大きな課題であり、どの学生が退学する可能性があり、どの学生が成功するかを予測することは困難である。
高校のGPAはドロップアウトの強い予測因子であるが、ドロップアウトのばらつきについては説明されていない。
本研究は,学生のモチベーションステートメントに含まれる情報を抽出する目的で,テキストマイニング技術を用いて大学中退を予測することに焦点を当てた。
テキストデータと古典的なドロップアウト予測器を学生特性の形で組み合わせることで、学生特性の予測が利用可能なセットを強化することを試みる。
2014年と2015年、オランダの大学における非選択的学士課程に入学する学生のモチベーションステートメントは7,060人であった。
サポートベクトルマシンはデータの75%でトレーニングされ、テストデータでいくつかのモデルが推定された。
我々は,TFiDF,トピックモデリング,LIWC辞書など,学生の特徴とテキストの組み合わせを多用した。
その結果, テキスト特性と学生特性の組み合わせは, ドロップアウト予測の改善には至らなかったが, テキスト分析だけでは, 学生特性のセットと同様にドロップアウトを予測できた。
今後の研究への提言がある。
関連論文リスト
- SentiDrop: A Multi Modal Machine Learning model for Predicting Dropout in Distance Learning [0.4369550829556578]
学校退学は遠隔学習において深刻な問題であり、早期発見は効果的な介入と生徒の忍耐のために重要である。
本稿では,BERTモデルを用いて,学生コメントの感情分析を組み合わせた新しいモデルを提案する。
ベースラインモデルでは82%に比べて84%の精度が得られた。
論文 参考訳(メタデータ) (2025-07-14T16:04:34Z) - Misspellings in Natural Language Processing: A survey [52.419589623702336]
デジタル通信では ミススペルがユビキタスになりました
我々は科学的な問題としてミススペルの歴史を再構築する。
NLPにおけるミススペル問題に対処するための最新の進歩について論じる。
論文 参考訳(メタデータ) (2025-01-28T10:26:04Z) - Predicting Long-Term Student Outcomes from Short-Term EdTech Log Data [24.198449873743762]
初回使用時間における学生のログを用いた機械学習予測器について検討した。
以上の結果から,2~5時間以内の短期ログ利用データを用いて,学生の長期外部パフォーマンスに関する貴重な情報を提供することが可能であることが示唆された。
論文 参考訳(メタデータ) (2024-12-20T01:05:23Z) - Why Do Students Drop Out? University Dropout Prediction and Associated
Factor Analysis Using Machine Learning Techniques [0.5042480200195721]
本研究では,学術,人口統計,社会経済,マクロ経済データ型を用いた大学ドロップアウト予測について検討した。
モデルの性能に最も影響を及ぼすデータ型は学術データであることが判明した。
予備的な結果は、データ型とドロップアウトステータスの間に相関が存在することを示している。
論文 参考訳(メタデータ) (2023-10-17T04:20:00Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - A Predictive Model for Student Performance in Classrooms Using Student
Interactions With an eTextbook [0.0]
本稿では,学生がインタラクティブなオンラインeTextbookとどのように相互作用するかの分析に基づいて,学生のパフォーマンスを予測する新しいモデルを提案する。
提案モデルを構築するために,データ構造とアルゴリズムのコースから得られたデータに基づいて,最も一般的な分類アルゴリズムと回帰アルゴリズムを評価した。
論文 参考訳(メタデータ) (2022-02-16T11:59:53Z) - Double Perturbation: On the Robustness of Robustness and Counterfactual
Bias Evaluation [109.06060143938052]
テストデータセットを超えたモデル弱点を明らかにするための"ダブル摂動"フレームワークを提案する。
この枠組みを,モデルの頑健さと英語における反事実バイアスの分析に使用される2つの摂動に基づくアプローチに応用する。
論文 参考訳(メタデータ) (2021-04-12T06:57:36Z) - Predicting MOOCs Dropout Using Only Two Easily Obtainable Features from
the First Week's Activities [56.1344233010643]
いくつかの特徴は、学習者の誘惑や興味の欠如に寄与すると考えられており、そのことが解脱や総減退につながる可能性がある。
この研究は、いくつかの機械学習アプローチを比較して、最初の1週間から早期のドロップアウトを予測することを目的としている。
論文 参考訳(メタデータ) (2020-08-12T10:44:49Z) - Academic Performance Estimation with Attention-based Graph Convolutional
Networks [17.985752744098267]
学生の過去のデータから、学生のパフォーマンス予測の課題は、将来のコースにおける生徒の成績を予測することである。
学生のパフォーマンス予測の伝統的な方法は、通常、複数のコース間の基礎となる関係を無視する。
本稿では,学生のパフォーマンス予測のための新しい注目型グラフ畳み込みネットワークモデルを提案する。
論文 参考訳(メタデータ) (2019-12-26T23:11:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。