論文の概要: College Dropout Factors: An Analysis with LightGBM and Shapley's
Cooperative Game Theory
- arxiv url: http://arxiv.org/abs/2311.06260v1
- Date: Tue, 26 Sep 2023 10:38:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 16:20:32.463182
- Title: College Dropout Factors: An Analysis with LightGBM and Shapley's
Cooperative Game Theory
- Title(参考訳): 大学退学要因:LightGBMとShapleyの協調ゲーム理論を用いた分析
- Authors: Hugo Roger Paz
- Abstract要約: 本研究は, FACET-UNTにおける土木系学生の学歴データ分析に基づく。
私たちの主な目的は、キャリアの落ち込みに大きな影響を与える、学術的なパフォーマンス変数を決定することです。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study was based on data analysis of academic histories of civil
engineering students at FACET-UNT. Our main objective was to determine the
academic performance variables that have a significant impact on the dropout of
the career. To do this, we implemented a correlation model using LightGBM
(Barbier et al., 2016; Ke et al., 2017; Shi et al., 2022). We use this model to
identify the key variables that influence the probability of student dropout.
In addition, we use game theory to interpret the results obtained.
Specifically, we use the SHAP library (Lundberg et al., 2018, 2020; Lundberg &
Lee, 2017) in Python to calculate the Shapley numbers.
The results of our study revealed the most important variables that influence
the dropout from the civil engineering career. Significant differences were
identified in terms of age, time spent in studies, and academic performance,
which includes the number of courses passed and the number of exams taken.
These results may be useful to develop more effective student retention
strategies and improve academic success in this discipline.
- Abstract(参考訳): 本研究は, FACET-UNTにおける土木系学生の学歴データ分析に基づく。
私たちの主な目的は、キャリアのドロップアウトに大きな影響を与えるアカデミックなパフォーマンス変数を決定することです。
これを実現するために,lightgbmを用いた相関モデルを実装した(barbier et al., 2016; ke et al., 2017; shi et al., 2022)。
このモデルを用いて,学生の退学確率に影響を与える重要な変数を同定する。
さらに,ゲーム理論を用いて得られた結果の解釈を行う。
具体的には、PythonのSHAPライブラリ(Lundberg et al., 2018, 2020; Lundberg & Lee, 2017)を使ってShapley数を計算します。
本研究の結果,土木工学のキャリアからの脱落に影響を与える最も重要な変数が明らかになった。
年齢、研究に費やす時間、受講数、受験数などの学業成績において有意差が認められた。
これらの結果は、より効果的な留学生維持戦略を開発し、この分野での学術的成功を改善するのに有用である。
関連論文リスト
- Rashomon effect in Educational Research: Why More is Better Than One for Measuring the Importance of the Variables? [0.0]
この研究は、決定木、ランダムな森林、軽いGBM、XGBoostアルゴリズムを用いてトレーニングされた、シンプルなyet-accurateモデルのRashomonセットを使用する。
その結果,Rashomonセットは予測精度を2~6%向上させることがわかった。
imd_band と highest_education が重要視されたが,その重要性はコースによって異なっていた。
論文 参考訳(メタデータ) (2024-12-02T14:05:36Z) - Hypothesizing Missing Causal Variables with LLMs [55.28678224020973]
我々は、入力が欠落変数を持つ部分因果グラフであるような新しいタスクを定式化し、出力は部分グラフを完成させるための欠落変数に関する仮説である。
原因と効果の間の媒介変数を仮説化するLLMの強い能力を示す。
また,オープンソースモデルの一部がGPT-4モデルより優れているという驚くべき結果も得られた。
論文 参考訳(メタデータ) (2024-09-04T10:37:44Z) - Does Starting Deep Learning Homework Earlier Improve Grades? [63.20583929886827]
宿題を早く始め、より多くの時間を費やしている学生は、宿題の成績が良くなるはずだ。
既存の文献が宿題に費やした時間の影響は明確ではなく、主にK-12教育から来ている。
我々は,学生の成功に対する影響を原則的に結論付けるために,階層的ベイズモデルを構築した。
論文 参考訳(メタデータ) (2023-09-30T09:34:30Z) - Prediction Model For Wordle Game Results With High Robustness [0.0]
本研究では,データ解析と機械学習を用いたWordleのダイナミクスに焦点を当てた。
単語の難易度を予測するために、私たちはバックプロパゲーションニューラルネットワークを採用し、機能工学によるオーバーフィッティングを克服した。
以上の結果から,2023年3月1日に約12,884件の結果が提出され,平均4.8回試みられ,最も難易度の高いクラスタに落下することが示唆された。
論文 参考訳(メタデータ) (2023-09-25T16:10:35Z) - Can Large Language Models Infer Causation from Correlation? [104.96351414570239]
大規模言語モデル(LLM)の純粋因果推論スキルをテストする。
相関文の集合を取り、変数間の因果関係を決定する新しいタスクCorr2Causeを定式化する。
これらのモデルがタスクのランダムな性能にほぼ近い結果が得られることを示す。
論文 参考訳(メタデータ) (2023-06-09T12:09:15Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Exploring the Impact of Instruction Data Scaling on Large Language
Models: An Empirical Study on Real-World Use Cases [17.431381376675432]
本稿では,命令データのスケールの異なる命令データに対して,命令チューニングに基づく大規模言語モデルの性能について検討する。
ベースモデルとしてBloomz-7B1-mtを用いると、命令データの量を増やすだけで、オープン・エンド・ジェネレーションのようなタスクが継続的に改善されることが示される。
本稿では,高品質なトレーニングデータ,スケールベースモデル,ハードタスクに特化したトレーニング手法を効果的に選択する,といった将来的な研究方向を提案する。
論文 参考訳(メタデータ) (2023-03-26T14:49:37Z) - When Do Curricula Work in Federated Learning? [56.88941905240137]
カリキュラム学習は非IID性を大幅に軽減する。
クライアント間でデータ配布を多様化すればするほど、学習の恩恵を受けるようになる。
本稿では,クライアントの現実的格差を生かした新しいクライアント選択手法を提案する。
論文 参考訳(メタデータ) (2022-12-24T11:02:35Z) - Student-centric Model of Learning Management System Activity and
Academic Performance: from Correlation to Causation [2.169383034643496]
近年,学生の学習行動パターンを理解するために,学習管理システム(LMS)における学習者のデジタルトレースのモデル化に多くの関心が寄せられている。
本稿では,LMS活動データに対する学生中心の分析フレームワークについて検討し,観察データから抽出した相関性だけでなく因果的洞察も提供する。
これらの知見は、大学生支援団体が学生中心で標的とする介入を開始するための証拠となると期待している。
論文 参考訳(メタデータ) (2022-10-27T14:08:25Z) - The Influence of Domain-Based Preprocessing on Subject-Specific
Clustering [55.41644538483948]
大学におけるオンライン教育の大部分を突然移行させることで、学者の作業負荷が増大した。
この問題に対処するひとつの方法は、トピックに応じてこれらの質問をクラスタ化することです。
本稿では,タグ付けデータセットの領域を探求し,コードの抜粋の同定と経験的結果の提供に焦点をあてる。
論文 参考訳(メタデータ) (2020-11-16T17:47:19Z) - A framework for predicting, interpreting, and improving Learning
Outcomes [0.0]
本研究では,学生の観察的,行動的,受験的特徴に基づいて,テストスコアを予測するEmbibe Score Quotient Model(ESQ)を開発した。
ESQは、学生の将来的な採点可能性の予測や、個別の学習ナッジの提供に使用することができる。
論文 参考訳(メタデータ) (2020-10-06T11:22:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。