論文の概要: SentiDrop: A Multi Modal Machine Learning model for Predicting Dropout in Distance Learning
- arxiv url: http://arxiv.org/abs/2507.10421v1
- Date: Mon, 14 Jul 2025 16:04:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:25.366141
- Title: SentiDrop: A Multi Modal Machine Learning model for Predicting Dropout in Distance Learning
- Title(参考訳): SentiDrop:遠隔学習におけるドロップアウト予測のためのマルチモーダル機械学習モデル
- Authors: Meriem Zerkouk, Miloud Mihoubi, Belkacem Chikhaoui,
- Abstract要約: 学校退学は遠隔学習において深刻な問題であり、早期発見は効果的な介入と生徒の忍耐のために重要である。
本稿では,BERTモデルを用いて,学生コメントの感情分析を組み合わせた新しいモデルを提案する。
ベースラインモデルでは82%に比べて84%の精度が得られた。
- 参考スコア(独自算出の注目度): 0.4369550829556578
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: School dropout is a serious problem in distance learning, where early detection is crucial for effective intervention and student perseverance. Predicting student dropout using available educational data is a widely researched topic in learning analytics. Our partner's distance learning platform highlights the importance of integrating diverse data sources, including socio-demographic data, behavioral data, and sentiment analysis, to accurately predict dropout risks. In this paper, we introduce a novel model that combines sentiment analysis of student comments using the Bidirectional Encoder Representations from Transformers (BERT) model with socio-demographic and behavioral data analyzed through Extreme Gradient Boosting (XGBoost). We fine-tuned BERT on student comments to capture nuanced sentiments, which were then merged with key features selected using feature importance techniques in XGBoost. Our model was tested on unseen data from the next academic year, achieving an accuracy of 84\%, compared to 82\% for the baseline model. Additionally, the model demonstrated superior performance in other metrics, such as precision and F1-score. The proposed method could be a vital tool in developing personalized strategies to reduce dropout rates and encourage student perseverance
- Abstract(参考訳): 学校退学は遠隔学習において深刻な問題であり、早期発見は効果的な介入と生徒の忍耐のために重要である。
利用可能な教育データを用いて学生のドロップアウトを予測することは、学習分析において広く研究されているトピックである。
我々のパートナーの遠隔学習プラットフォームは、ドロップアウトリスクを正確に予測するために、社会デコグラフィーデータ、行動データ、感情分析を含む多様なデータソースを統合することの重要性を強調しています。
本稿では,変換器を用いた双方向エンコーダ表現(BERT)モデルを用いた学生コメントの感情分析と,エクストリーム・グラディエント・ブースティング(XGBoost)を用いた社会デマトグラフィーおよび行動データを組み合わせた新しいモデルを提案する。
BERTを学生コメントに微調整し、ニュアンスのある感情を捉え、XGBoostの機能重要技術を用いて選択された重要な特徴とマージした。
ベースラインモデルでは88%に対して84%の精度を実現した。
さらに、このモデルは精度やF1スコアといった他の指標よりも優れた性能を示した。
提案手法は、ドロップアウト率を低減し、学生の忍耐を奨励するパーソナライズされた戦略を開発する上で欠かせないツールとなる可能性がある。
関連論文リスト
- Predicting Student Dropout Risk With A Dual-Modal Abrupt Behavioral Changes Approach [11.034576265432168]
Dual-Modal Multiscale Sliding Window (DMSW) モデルは,学術的パフォーマンスと行動データを統合し,最小限のデータを用いて行動パターンをキャプチャする。
DMSWモデルでは従来の手法に比べて予測精度が15%向上し,高リスクの生徒を早期に特定できるようになった。
これらの知見は、ドロップアウト予測における理論と実践のギャップを埋め、教育者は学生の維持と成果を高める革新的なツールとなる。
論文 参考訳(メタデータ) (2025-05-16T11:02:55Z) - Ranking-Based At-Risk Student Prediction Using Federated Learning and Differential Features [4.21051987964486]
本研究では,フェデレーション学習と差分特徴を組み合わせ,プライバシー問題に対処する手法を提案する。
提案手法を評価するため,12科12科136名のデータを用いて,リスクの高い学生の予測モデルを構築した。
訓練されたモデルは早期予測にも適用可能で、学期前半のリスクの高い学生を検知する上で高い性能を達成できた。
論文 参考訳(メタデータ) (2025-05-14T11:12:30Z) - Modeling Behavior Change for Multi-model At-Risk Students Early Prediction (extended version) [10.413751893289056]
現在のモデルは、単純かつ離散的な行動パターンを通じて、一貫してパフォーマンスの悪い学生を識別する。
我々は,中学校の教師の発言データと数値グレードデータを利用した,革新的な予測モデルであるMultimodal-ChangePoint Detection (MCPD)を開発した。
本モデルでは,ベースラインアルゴリズムの平均性能を約5~10%向上させるとともに,70~75%の精度範囲を達成している。
論文 参考訳(メタデータ) (2025-02-19T11:16:46Z) - What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - Exploring and Enhancing the Transfer of Distribution in Knowledge Distillation for Autoregressive Language Models [62.5501109475725]
知識蒸留(KD)は、より小さな学生モデルを模倣するように訓練することで、大きな教師モデルを圧縮する技術である。
本稿では、教師ネットワークが小さなオンラインモジュールを統合し、学生モデルと同時学習するオンライン知識蒸留(OKD)について紹介する。
OKDは、様々なモデルアーキテクチャやサイズにおけるリードメソッドのパフォーマンスを達成または超え、トレーニング時間を最大4倍に短縮する。
論文 参考訳(メタデータ) (2024-09-19T07:05:26Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - Customizing Synthetic Data for Data-Free Student Learning [6.8080936803807734]
DFKDは、オリジナルトレーニングデータなしで軽量な学生モデルを得ることを目指している。
生徒モデルをより効果的に訓練するために、合成データを現在の学生学習能力に合わせてカスタマイズする。
本稿では,データ自由学習(CSD)のための合成データのカスタマイズを提案する。
論文 参考訳(メタデータ) (2023-07-10T13:17:29Z) - Robust Learning with Progressive Data Expansion Against Spurious
Correlation [65.83104529677234]
本研究では,2層非線形畳み込みニューラルネットワークの学習過程について検討した。
分析の結果,不均衡なデータ群と学習容易なスプリアス特徴が学習過程におけるスプリアス特徴の優位性に繋がる可能性が示唆された。
本稿では,PDEと呼ばれる新たなトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-08T05:44:06Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Understanding Robustness in Teacher-Student Setting: A New Perspective [42.746182547068265]
適応的な例は機械学習モデルで、有界な対向的摂動はモデルを誤解させ、任意に誤った予測をすることができる。
広範な研究は、逆例の存在を説明し、モデルのロバスト性を改善する方法を提供する。
我々の研究は、敵対的な事例に関する将来の探索を暗示し、原則化されたデータ拡張を通じてモデルロバスト性を高めることができる。
論文 参考訳(メタデータ) (2021-02-25T20:54:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。