論文の概要: A Multi-level Analysis of Factors Associated with Student Performance: A Machine Learning Approach to the SAEB Microdata
- arxiv url: http://arxiv.org/abs/2510.22266v1
- Date: Sat, 25 Oct 2025 12:15:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.010659
- Title: A Multi-level Analysis of Factors Associated with Student Performance: A Machine Learning Approach to the SAEB Microdata
- Title(参考訳): 学生のパフォーマンスに関連する要因の多段階分析:SAEBマイクロデータへの機械学習アプローチ
- Authors: Rodrigo Tertulino, Ricardo Almeida,
- Abstract要約: 本研究では,9年生・高校生の習熟度を分類する多段階機械学習手法を提案する。
本モデルでは,学生の社会経済特性,教師の専門的プロファイル,学校の指標,監督管理プロファイルの4つのデータソースを統合した。
- 参考スコア(独自算出の注目度): 0.07161783472741748
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying the factors that influence student performance in basic education is a central challenge for formulating effective public policies in Brazil. This study introduces a multi-level machine learning approach to classify the proficiency of 9th-grade and high school students using microdata from the System of Assessment of Basic Education (SAEB). Our model uniquely integrates four data sources: student socioeconomic characteristics, teacher professional profiles, school indicators, and director management profiles. A comparative analysis of four ensemble algorithms confirmed the superiority of a Random Forest model, which achieved 90.2% accuracy and an Area Under the Curve (AUC) of 96.7%. To move beyond prediction, we applied Explainable AI (XAI) using SHAP, which revealed that the school's average socioeconomic level is the most dominant predictor, demonstrating that systemic factors have a greater impact than individual characteristics in isolation. The primary conclusion is that academic performance is a systemic phenomenon deeply tied to the school's ecosystem. This study provides a data-driven, interpretable tool to inform policies aimed at promoting educational equity by addressing disparities between schools.
- Abstract(参考訳): 基礎教育における学生のパフォーマンスに影響を与える要因を特定することは、ブラジルにおける効果的な公共政策を定式化するための中心的な課題である。
本研究では,初等教育評価システム(SAEB)のマイクロデータを用いて,9年生・高校生の習熟度を分類する多段階機械学習手法を提案する。
本モデルは,学生の社会経済特性,教員の専門的プロファイル,学校の指標,監督管理プロファイルの4つのデータソースを一意に統合する。
4つのアンサンブルアルゴリズムの比較分析により、90.2%の精度を達成したランダムフォレストモデルと96.7%のエリア・アンダー・ザ・カーブ(AUC)の優位性が確認された。
予測を超えて、SHAPを用いて説明可能なAI(XAI)を適用し、学校の平均社会経済レベルが最も支配的な予測因子であることを明らかにする。
主な結論は、学業成績は学校の生態系に深く結びついている体系的な現象であるということである。
本研究は、学校間の格差に対処することで、教育的平等を促進するための政策を伝えるための、データ駆動型解釈可能なツールを提供する。
関連論文リスト
- Reliable and Reproducible Demographic Inference for Fairness in Face Analysis [63.46525489354455]
本稿では、従来のエンドツーエンドトレーニングをモジュラートランスファー学習アプローチで置き換える、完全に再現可能なDAIパイプラインを提案する。
このパイプラインは、正確性、公正性、そしてアイデンティティ内整合性によって定義される、新たに導入された堅牢性の概念の3つの次元にわたって監査する。
以上の結果から,提案手法は特に民族性において,強い基準線を上回り,その特性はより困難であることが示唆された。
論文 参考訳(メタデータ) (2025-10-23T12:22:02Z) - AI-Driven Personalized Learning: Predicting Academic Per-formance Through Leadership Personality Traits [0.0]
この研究は、パーソナライズされた学習におけるAI技術の可能性を探る。
リーダーシップパーソナリティ特性と機械学習モデリングによる学術的成功の予測を提案する。
論文 参考訳(メタデータ) (2025-10-22T18:47:30Z) - Explainable AI and Machine Learning for Exam-based Student Evaluation: Causal and Predictive Analysis of Socio-academic and Economic Factors [1.2163458046014015]
学業成績は、社会学と財政学の多変量ネクサスに依存する。
本研究では,学生のCGPAを最適化するための効果的な戦略を開発するために,これらの影響について検討する。
論文 参考訳(メタデータ) (2025-08-01T17:09:49Z) - AI-based identification and support of at-risk students: A case study of the Moroccan education system [5.199084419479099]
学生の退学は、個人的、家族的、学術的要因に影響される世界的な問題である。
本稿では,退学リスクのある学生を識別するAIによる予測モデル手法を提案する。
論文 参考訳(メタデータ) (2025-04-09T13:30:35Z) - Understanding the Disparities in Mathematics Performance: An Interpretability-Based Examination [0.5266869303483376]
本研究は,数学性能の教育格差に寄与する複雑な要因を明らかにすることを目的とする。
低い社会経済的背景を持つ学生は少ない本を持ち、数学の成績が低いことを証明している。
ジェンダーもまた決定要因として現れ、メスはスペクトル全体のパフォーマンスレベルに異なる貢献をした。
論文 参考訳(メタデータ) (2025-01-29T00:44:01Z) - Machine Learning Predicts Upper Secondary Education Dropout as Early as the End of Primary School [0.0]
本研究は、幼稚園から9年生までのデータを含む13年間の縦断データセットを用いて、モデリングの地平を広げた。
本手法は,学生の学術的・認知的スキル,モチベーション,行動,幸福感,公式記録されたドロップアウトデータなど,幅広いパラメータを取り入れた。
本研究で開発された機械学習モデルでは, 曲線(AUC)の平均面積が0.61まで, 改善されたAUCは0.65まで, グレード9まで, 顕著な分類能力を示した。
論文 参考訳(メタデータ) (2024-03-01T13:18:08Z) - Sensitivity, Performance, Robustness: Deconstructing the Effect of
Sociodemographic Prompting [64.80538055623842]
社会デマトグラフィープロンプトは、特定の社会デマトグラフィープロファイルを持つ人間が与える答えに向けて、プロンプトベースのモデルの出力を操縦する技術である。
ソシオデマトグラフィー情報はモデル予測に影響を及ぼし、主観的NLPタスクにおけるゼロショット学習を改善するのに有用であることを示す。
論文 参考訳(メタデータ) (2023-09-13T15:42:06Z) - Ecosystem-level Analysis of Deployed Machine Learning Reveals Homogeneous Outcomes [72.13373216644021]
本研究では,機械学習の社会的影響を,特定の文脈に展開されるモデルの集合を考慮し検討する。
デプロイされた機械学習はシステム障害を起こしやすいため、利用可能なすべてのモデルに排他的に誤分類されているユーザもいます。
これらの例は、エコシステムレベルの分析が、機械学習の社会的影響を特徴づける独自の強みを持っていることを示している。
論文 参考訳(メタデータ) (2023-07-12T01:11:52Z) - Through the Data Management Lens: Experimental Analysis and Evaluation
of Fair Classification [75.49600684537117]
データ管理研究は、データとアルゴリズムの公平性に関連するトピックに対する存在感と関心が高まっている。
我々は,その正しさ,公平性,効率性,スケーラビリティ,安定性よりも,13の公正な分類アプローチと追加の変種を幅広く分析している。
我々の分析は、異なるメトリクスとハイレベルなアプローチ特性がパフォーマンスの異なる側面に与える影響に関する新しい洞察を強調します。
論文 参考訳(メタデータ) (2021-01-18T22:55:40Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。