論文の概要: Centralized vs. Federated Learning for Educational Data Mining: A Comparative Study on Student Performance Prediction with SAEB Microdata
- arxiv url: http://arxiv.org/abs/2509.00086v1
- Date: Wed, 27 Aug 2025 10:30:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.064815
- Title: Centralized vs. Federated Learning for Educational Data Mining: A Comparative Study on Student Performance Prediction with SAEB Microdata
- Title(参考訳): 教育データマイニングにおける集中型対フェデレーション学習:SAEBマイクロデータを用いた学生のパフォーマンス予測の比較
- Authors: Rodrigo Tertulino,
- Abstract要約: 本研究は,フェデレート学習,特にFedProxアルゴリズムの有効性と有効性を評価し,学生の成績を予測する。
この分析は200万人以上の学生の記録で行われ、中央集権モデルの精度は63.96%に達した。
注目すべきは、フェデレートされたモデルが最高精度61.23%に達したことだ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The application of data mining and artificial intelligence in education offers unprecedented potential for personalizing learning and early identification of at-risk students. However, the practical use of these techniques faces a significant barrier in privacy legislation, such as Brazil's General Data Protection Law (LGPD), which restricts the centralization of sensitive student data. To resolve this challenge, privacy-preserving computational approaches are required. The present study evaluates the feasibility and effectiveness of Federated Learning, specifically the FedProx algorithm, to predict student performance using microdata from the Brazilian Basic Education Assessment System (SAEB). A Deep Neural Network (DNN) model was trained in a federated manner, simulating a scenario with 50 schools, and its performance was rigorously benchmarked against a centralized eXtreme Gradient Boosting (XGBoost) model. The analysis, conducted on a universe of over two million student records, revealed that the centralized model achieved an accuracy of 63.96%. Remarkably, the federated model reached a peak accuracy of 61.23%, demonstrating a marginal performance loss in exchange for a robust privacy guarantee. The results indicate that Federated Learning is a viable and effective solution for building collaborative predictive models in the Brazilian educational context, in alignment with the requirements of the LGPD.
- Abstract(参考訳): データマイニングと人工知能の教育への応用は、学習をパーソナライズし、リスクの高い学生を早期に識別する前例のない可能性を秘めている。
しかし、これらの手法の実用化は、ブラジルの総合データ保護法(LGPD)のようなプライバシー法の重大な障壁に直面している。
この問題を解決するには、プライバシ保護の計算アプローチが必要である。
本研究では,ブラジル基礎教育評価システム(SAEB)のマイクロデータを用いて,フェデレートラーニング,特にFedProxアルゴリズムの有効性と有効性を評価した。
ディープニューラルネットワーク(DNN)モデルは50の学校でシナリオをシミュレートするフェデレートされた方法でトレーニングされ、そのパフォーマンスは集中型eXtreme Gradient Boosting(XGBoost)モデルに対して厳格にベンチマークされた。
この分析は200万人以上の学生の記録で行われ、中央集権モデルの精度は63.96%に達した。
注目すべきは、フェデレートされたモデルが最高精度61.23%に達したことだ。
その結果, フェデレートラーニングは, LGPDの要求に応じて, ブラジルの教育文脈において協調予測モデルを構築する上で, 有効かつ効果的なソリューションであることが示唆された。
関連論文リスト
- Evaluating Federated Learning for At-Risk Student Prediction: A Comparative Analysis of Model Complexity and Data Balancing [0.0]
遠隔教育における高いドロップアウト率と失敗率は、学術機関にとって大きな課題である。
本研究は、イギリスの大学における学生のリスクを予測するために、初期の学術的パフォーマンスとデジタルエンゲージメントパターンに基づく機械学習モデルを開発し、評価する。
論文 参考訳(メタデータ) (2025-08-23T19:58:16Z) - Ranking-Based At-Risk Student Prediction Using Federated Learning and Differential Features [4.21051987964486]
本研究では,フェデレーション学習と差分特徴を組み合わせ,プライバシー問題に対処する手法を提案する。
提案手法を評価するため,12科12科136名のデータを用いて,リスクの高い学生の予測モデルを構築した。
訓練されたモデルは早期予測にも適用可能で、学期前半のリスクの高い学生を検知する上で高い性能を達成できた。
論文 参考訳(メタデータ) (2025-05-14T11:12:30Z) - RiM: Record, Improve and Maintain Physical Well-being using Federated Learning [1.1510009152620668]
我々は、新しいパーソナライズされた機械学習フレームワークを組み込んだモバイルアプリケーションであるRiM: Record, Improve, and Maintainを紹介する。
我々のアプローチでは、パーセプトロン(MLP)モデルを大規模なシミュレーションデータセット上で事前学習し、パーソナライズされたレコメンデーションを生成する。
我々は、IISER Bhopalの学生のデータを用いてモデルを微調整するために、フェデレートラーニングを採用し、現実世界のシナリオでその適用性を確保する。
論文 参考訳(メタデータ) (2025-05-09T19:08:39Z) - Privacy-Preserved Automated Scoring using Federated Learning for Educational Research [1.2556373621040728]
本稿では,教育評価の自動評価のための統合学習(FL)フレームワークを提案する。
我々は,2つの最先端FL手法と集中学習ベースラインに対して,我々のモデルをベンチマークする。
その結果,本モデルが最も精度が高い(94.5%)ことが示唆された。
論文 参考訳(メタデータ) (2025-03-12T19:06:25Z) - Benchmarking Vision Language Model Unlearning via Fictitious Facial Identity Dataset [92.99416966226724]
我々は、未学習アルゴリズムの有効性を頑健に評価するために設計された新しいVLMアンラーニングベンチマークであるFacial Identity Unlearning Benchmark (FIUBench)を紹介する。
情報ソースとその露出レベルを正確に制御する2段階評価パイプラインを適用した。
FIUBench 内の 4 つのベースライン VLM アンラーニングアルゴリズムの評価により,すべての手法がアンラーニング性能に制限されていることが明らかとなった。
論文 参考訳(メタデータ) (2024-11-05T23:26:10Z) - Pseudo-Probability Unlearning: Towards Efficient and Privacy-Preserving Machine Unlearning [59.29849532966454]
本稿では,PseudoProbability Unlearning (PPU)を提案する。
提案手法は,最先端の手法に比べて20%以上の誤りを忘れる改善を実現している。
論文 参考訳(メタデータ) (2024-11-04T21:27:06Z) - "You Can't Fix What You Can't Measure": Privately Measuring Demographic
Performance Disparities in Federated Learning [78.70083858195906]
グループメンバーシップのプライバシを保護しつつ,グループ間でのパフォーマンスの差異を測定するための,差分プライベートなメカニズムを提案する。
我々の結果は、以前の研究の示唆に反して、プライバシ保護は必ずしもフェデレーションモデルの性能格差の特定と矛盾しているわけではないことを示している。
論文 参考訳(メタデータ) (2022-06-24T09:46:43Z) - Decentralized Federated Learning Preserves Model and Data Privacy [77.454688257702]
我々は、訓練されたモデル間で知識を共有することができる、完全に分散化されたアプローチを提案する。
生徒は、合成された入力データを通じて教師の出力を訓練する。
その結果,教師が学習した未学習学生モデルが,教師と同等のF1スコアに達することがわかった。
論文 参考訳(メタデータ) (2021-02-01T14:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。