論文の概要: Deep Learning for School Dropout Detection: A Comparison of Tabular and Graph-Based Models for Predicting At-Risk Students
- arxiv url: http://arxiv.org/abs/2508.14057v1
- Date: Sat, 09 Aug 2025 01:19:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-24 10:27:26.529611
- Title: Deep Learning for School Dropout Detection: A Comparison of Tabular and Graph-Based Models for Predicting At-Risk Students
- Title(参考訳): 学校ドロップアウト検出のための深層学習--タブラリモデルとグラフモデルの比較-
- Authors: Pablo G. Almeida, Guilherme A. L. Silva, Valéria Santos, Gladston Moreira, Pedro Silva, Eduardo Luz,
- Abstract要約: 学生の退学は、世界中の教育システムにおいて重要な課題である。
グラフニューラルネットワーク(GNN)は、グラフとして構造化された場合、学生データに固有の複雑な関係をキャプチャすることで潜在的な利点を提供する。
- 参考スコア(独自算出の注目度): 0.2029906424353094
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Student dropout is a significant challenge in educational systems worldwide, leading to substantial social and economic costs. Predicting students at risk of dropout allows for timely interventions. While traditional Machine Learning (ML) models operating on tabular data have shown promise, Graph Neural Networks (GNNs) offer a potential advantage by capturing complex relationships inherent in student data if structured as graphs. This paper investigates whether transforming tabular student data into graph structures, primarily using clustering techniques, enhances dropout prediction accuracy. We compare the performance of GNNs (a custom Graph Convolutional Network (GCN) and GraphSAGE) on these generated graphs against established tabular models (Random Forest (RF), XGBoost, and TabNet) using a real-world student dataset. Our experiments explore various graph construction strategies based on different clustering algorithms (K-Means, HDBSCAN) and dimensionality reduction techniques (Principal Component Analysis (PCA), Uniform Manifold Approximation and Projection (UMAP)). Our findings demonstrate that a specific GNN configuration, GraphSAGE on a graph derived from PCA-KMeans clustering, achieved superior performance, notably improving the macro F1-score by approximately 7 percentage points and accuracy by nearly 2 percentage points over the strongest tabular baseline (XGBoost). However, other GNN configurations and graph construction methods did not consistently surpass tabular models, emphasizing the critical role of the graph generation strategy and GNN architecture selection. This highlights both the potential of GNNs and the challenges in optimally transforming tabular data for graph-based learning in this domain.
- Abstract(参考訳): 学生の退学は世界中の教育システムにおいて重要な課題であり、社会と経済のかなりのコストに繋がる。
退学リスクのある生徒の予測は、タイムリーな介入を可能にする。
従来の機械学習(ML)モデルは表型データで動作するが、グラフニューラルネットワーク(GNN)は、グラフとして構造化された場合、学生データに固有の複雑な関係をキャプチャする潜在的な利点を提供する。
本稿では,主にクラスタリング技術を用いて,表形式の学生データをグラフ構造に変換することにより,ドロップアウト予測精度が向上するかどうかを検討する。
GNN(カスタムグラフ畳み込みネットワーク(GCN)とグラフSAGE)の性能を、既存のグラフモデル(Random Forest(RF)、XGBoost、TabNet)と比較する。
実験では,異なるクラスタリングアルゴリズム (K-Means, HDBSCAN) と次元減少手法 (主成分分析 (PCA, Uniform Manifold Approximation and Projection, UMAP) に基づくグラフ構築戦略について検討した。
以上の結果から,PCA-KMeansクラスタリングによるグラフ上のGNN構成であるグラフSAGEは,マクロF1スコアを約7ポイント向上し,最強の表表ベースライン(XGBoost)よりも約2ポイント精度が向上した。
しかし、グラフ生成戦略とGNNアーキテクチャ選択の重要な役割を強調し、他のGNN構成やグラフ構築手法は一貫して表形式モデルを超えなかった。
これは、GNNの可能性と、この領域におけるグラフベースの学習のための表データの最適変換の課題の両方を強調している。
関連論文リスト
- GLANCE: Graph Logic Attention Network with Cluster Enhancement for Heterophilous Graph Representation Learning [54.60090631330295]
グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習する上で大きな成功を収めている。
本稿では,論理誘導推論,動的グラフ改善,適応クラスタリングを統合し,グラフ表現学習を強化する新しいフレームワークであるGLANCEを提案する。
論文 参考訳(メタデータ) (2025-07-24T15:45:26Z) - Revisiting Graph Neural Networks on Graph-level Tasks: Comprehensive Experiments, Analysis, and Improvements [54.006506479865344]
グラフレベルグラフニューラルネットワーク(GNN)のための統一評価フレームワークを提案する。
このフレームワークは、さまざまなデータセットにわたるGNNを評価するための標準化された設定を提供する。
また,表現性の向上と一般化機能を備えた新しいGNNモデルを提案する。
論文 参考訳(メタデータ) (2025-01-01T08:48:53Z) - OpenGraph: Towards Open Graph Foundation Models [20.401374302429627]
グラフニューラルネットワーク(GNN)は、構造情報を符号化するための有望な技術として登場した。
主な課題は、異なる性質を持つグラフデータを一般化することの難しさである。
この課題に対処するために,OpenGraphと呼ばれる新しいグラフ基盤モデルを提案する。
論文 参考訳(メタデータ) (2024-03-02T08:05:03Z) - GraphGLOW: Universal and Generalizable Structure Learning for Graph
Neural Networks [72.01829954658889]
本稿では,この新たな問題設定の数学的定義を紹介する。
一つのグラフ共有構造学習者と複数のグラフ固有GNNを協調する一般的なフレームワークを考案する。
十分に訓練された構造学習者は、微調整なしで、目に見えない対象グラフの適応的な構造を直接生成することができる。
論文 参考訳(メタデータ) (2023-06-20T03:33:22Z) - Towards Unsupervised Deep Graph Structure Learning [67.58720734177325]
本稿では,学習したグラフトポロジを外部ガイダンスなしでデータ自身で最適化する,教師なしグラフ構造学習パラダイムを提案する。
具体的には、元のデータから"アンカーグラフ"として学習目標を生成し、対照的な損失を用いてアンカーグラフと学習グラフとの一致を最大化する。
論文 参考訳(メタデータ) (2022-01-17T11:57:29Z) - Graph Contrastive Learning with Augmentations [109.23158429991298]
グラフデータの教師なし表現を学習するためのグラフコントラスト学習(GraphCL)フレームワークを提案する。
我々のフレームワークは、最先端の手法と比較して、類似またはより良い一般化可能性、転送可能性、堅牢性のグラフ表現を作成できることを示す。
論文 参考訳(メタデータ) (2020-10-22T20:13:43Z) - GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training [62.73470368851127]
グラフ表現学習は現実世界の問題に対処する強力な手法として登場した。
自己教師付きグラフニューラルネットワーク事前トレーニングフレームワークであるGraph Contrastive Codingを設計する。
3つのグラフ学習タスクと10のグラフデータセットについて実験を行った。
論文 参考訳(メタデータ) (2020-06-17T16:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。