論文の概要: Ranking-Based At-Risk Student Prediction Using Federated Learning and Differential Features
- arxiv url: http://arxiv.org/abs/2505.09287v1
- Date: Wed, 14 May 2025 11:12:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.429923
- Title: Ranking-Based At-Risk Student Prediction Using Federated Learning and Differential Features
- Title(参考訳): フェデレーションラーニングと差分特徴を用いたランキングベースオンライン学生予測
- Authors: Shunsuke Yoneda, Valdemar Švábenský, Gen Li, Daisuke Deguchi, Atsushi Shimada,
- Abstract要約: 本研究では,フェデレーション学習と差分特徴を組み合わせ,プライバシー問題に対処する手法を提案する。
提案手法を評価するため,12科12科136名のデータを用いて,リスクの高い学生の予測モデルを構築した。
訓練されたモデルは早期予測にも適用可能で、学期前半のリスクの高い学生を検知する上で高い性能を達成できた。
- 参考スコア(独自算出の注目度): 4.21051987964486
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Digital textbooks are widely used in various educational contexts, such as university courses and online lectures. Such textbooks yield learning log data that have been used in numerous educational data mining (EDM) studies for student behavior analysis and performance prediction. However, these studies have faced challenges in integrating confidential data, such as academic records and learning logs, across schools due to privacy concerns. Consequently, analyses are often conducted with data limited to a single school, which makes developing high-performing and generalizable models difficult. This study proposes a method that combines federated learning and differential features to address these issues. Federated learning enables model training without centralizing data, thereby preserving student privacy. Differential features, which utilize relative values instead of absolute values, enhance model performance and generalizability. To evaluate the proposed method, a model for predicting at-risk students was trained using data from 1,136 students across 12 courses conducted over 4 years, and validated on hold-out test data from 5 other courses. Experimental results demonstrated that the proposed method addresses privacy concerns while achieving performance comparable to that of models trained via centralized learning in terms of Top-n precision, nDCG, and PR-AUC. Furthermore, using differential features improved prediction performance across all evaluation datasets compared to non-differential approaches. The trained models were also applicable for early prediction, achieving high performance in detecting at-risk students in earlier stages of the semester within the validation datasets.
- Abstract(参考訳): デジタル教科書は、大学コースやオンライン講義など、様々な教育的文脈で広く使われている。
このような教科書は、学生の行動分析とパフォーマンス予測のために多くの教育データマイニング(EDM)研究で使用されている学習ログデータを生成する。
しかし、これらの研究は、プライバシー上の懸念から学校間で学術記録や学習ログなどの機密データを統合する上で困難に直面している。
その結果、分析は1つの学校に限定されたデータで行われることが多く、高性能で一般化可能なモデルの開発が困難になる。
本研究では,これらの課題に対処するために,フェデレーション学習と差分特徴を組み合わせた手法を提案する。
フェデレーション学習は、データの集中化なしにモデルトレーニングを可能にし、生徒のプライバシを保護します。
絶対値の代わりに相対値を利用する差分特徴は、モデル性能と一般化可能性を高める。
提案手法を評価するために,12科12科136名のデータを用いて,リスクの高い学生の予測モデルを訓練し,他の5科5科の保持試験データに基づいて検証を行った。
実験の結果,提案手法は,Top-n精度,nDCG,PR-AUCで学習したモデルに匹敵する性能を保ちながら,プライバシの問題に対処することを示した。
さらに、差分特徴を用いることで、非差分アプローチと比較して、すべての評価データセットでの予測性能が向上した。
トレーニングされたモデルは、早期予測にも適用可能で、検証データセット内の学期前期のリスクの高い学生を検出できる。
関連論文リスト
- Privacy-Preserved Automated Scoring using Federated Learning for Educational Research [1.2556373621040728]
本稿では,教育評価の自動評価のための統合学習(FL)フレームワークを提案する。
我々は,2つの最先端FL手法と集中学習ベースラインに対して,我々のモデルをベンチマークする。
その結果,本モデルが最も精度が高い(94.5%)ことが示唆された。
論文 参考訳(メタデータ) (2025-03-12T19:06:25Z) - Modeling Behavior Change for Multi-model At-Risk Students Early Prediction (extended version) [10.413751893289056]
現在のモデルは、単純かつ離散的な行動パターンを通じて、一貫してパフォーマンスの悪い学生を識別する。
我々は,中学校の教師の発言データと数値グレードデータを利用した,革新的な予測モデルであるMultimodal-ChangePoint Detection (MCPD)を開発した。
本モデルでは,ベースラインアルゴリズムの平均性能を約5~10%向上させるとともに,70~75%の精度範囲を達成している。
論文 参考訳(メタデータ) (2025-02-19T11:16:46Z) - Research on Education Big Data for Students Academic Performance Analysis based on Machine Learning [8.556825982336807]
本研究では,Long Short-Term Memory Network(LSTM)に基づく機械学習モデルを用いて,教育用ビッグデータの詳細な分析を行った。
LSTMモデルは時系列データを効率的に処理し、学生の学習活動における時間依存的・長期的傾向を捉えることができる。
このアプローチは、生徒の進歩、エンゲージメント、その他の行動パターンを分析してパーソナライズされた教育を支援するのに特に有用である。
論文 参考訳(メタデータ) (2024-06-25T01:19:22Z) - Data Shapley in One Training Run [88.59484417202454]
Data Shapleyは、機械学習コンテキストにおけるデータのコントリビューションに寄与するための、原則化されたフレームワークを提供する。
既存のアプローチでは、計算集約的な異なるデータサブセット上の再学習モデルが必要である。
本稿では、対象とするデータモデルに対するスケーラブルなデータ属性を提供することにより、これらの制限に対処するIn-Run Data Shapleyを紹介する。
論文 参考訳(メタデータ) (2024-06-16T17:09:24Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Predicting student performance using sequence classification with
time-based windows [1.5836913530330787]
本研究では,学生の行動データから得られた逐次的パターンに基づいて,正確な予測モデルを構築することができることを示す。
本稿では,行動データの時間的側面を把握し,モデルの性能予測に与える影響を解析する手法を提案する。
改良されたシーケンス分類手法は,高レベルの精度で生徒のパフォーマンスを予測でき,コース固有のモデルでは90%に達する。
論文 参考訳(メタデータ) (2022-08-16T13:46:39Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - Self Training with Ensemble of Teacher Models [8.257085583227695]
堅牢なディープラーニングモデルのトレーニングには,大量のラベル付きデータが必要である。
このようなラベル付きデータの大規模なリポジトリがなければ、ラベルなしのデータも同様に利用することができる。
準スーパービジョン学習は、そのようなラベルのないデータを分類モデルの訓練に活用することを目的としている。
論文 参考訳(メタデータ) (2021-07-17T09:44:09Z) - Dual-Teacher: Integrating Intra-domain and Inter-domain Teachers for
Annotation-efficient Cardiac Segmentation [65.81546955181781]
本稿では,新しい半教師付きドメイン適応手法,すなわちDual-Teacherを提案する。
学生モデルは、2つの教師モデルによってラベル付けされていない対象データとラベル付けされた情報源データの知識を学習する。
提案手法では, ラベルなしデータとモダリティ間データとを並列に利用でき, 性能が向上することを示した。
論文 参考訳(メタデータ) (2020-07-13T10:00:44Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。