論文の概要: Modelling higher education dropouts using sparse and interpretable post-clustering logistic regression
- arxiv url: http://arxiv.org/abs/2505.07582v1
- Date: Mon, 12 May 2025 14:05:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.418769
- Title: Modelling higher education dropouts using sparse and interpretable post-clustering logistic regression
- Title(参考訳): スパースと解釈可能なクラスタリング後ロジスティック回帰を用いた高等教育のドロップアウトのモデル化
- Authors: Andrea Nigri, Massimo Bilancia, Barbara Cafarelli, Samuele Magro,
- Abstract要約: 高等教育のドロップアウトは、世界中の第三次教育システムにとって重要な課題である。
本稿では,ロジスティック回帰の特殊形式として,大学ドロップアウト分析の文脈に特化して導入したモデルについて述べる。
- 参考スコア(独自算出の注目度): 0.8437187555622164
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Higher education dropout constitutes a critical challenge for tertiary education systems worldwide. While machine learning techniques can achieve high predictive accuracy on selected datasets, their adoption by policymakers remains limited and unsatisfactory, particularly when the objective is the unsupervised identification and characterization of student subgroups at elevated risk of dropout. The model introduced in this paper is a specialized form of logistic regression, specifically adapted to the context of university dropout analysis. Logistic regression continues to serve as a foundational tool among reliable statistical models, primarily due to the ease with which its parameters can be interpreted in terms of odds ratios. Our approach significantly extends this framework by incorporating heterogeneity within the student population. This is achieved through the application of a preliminary clustering algorithm that identifies latent subgroups, each characterized by distinct dropout propensities, which are then modeled via cluster-specific effects. We provide a detailed interpretation of the model parameters within this extended framework and enhance interpretability by imposing sparsity through a tailored variant of the LASSO algorithm. To demonstrate the practical applicability of the proposed methodology, we present an extensive case study based on the Italian university system, in which all the developed tools are systematically applied
- Abstract(参考訳): 高等教育のドロップアウトは、世界中の第三次教育システムにとって重要な課題である。
機械学習技術は、選択したデータセットに対して高い予測精度を達成できるが、政策立案者による採用は限定的で満足できない。
本稿では,ロジスティック回帰の特殊形式として,大学ドロップアウト分析の文脈に特化して導入したモデルについて述べる。
ロジスティック回帰は信頼性のある統計モデルにおける基礎的なツールとして機能し続けており、主に奇数比の観点からそのパラメータが解釈しやすいためである。
本手法は,学生集団に不均一性を組み込むことによって,この枠組みを著しく拡張する。
これは、潜在サブグループを識別する予備クラスタリングアルゴリズムの適用によって実現され、それぞれが異なるドロップアウト確率によって特徴づけられ、クラスタ固有の効果によってモデル化される。
本稿では,この拡張フレームワーク内でのモデルパラメータの詳細な解釈と,LASSOアルゴリズムの修正版による疎結合化による解釈性の向上について述べる。
提案手法の実践的適用性を実証するため,イタリア大学システムに基づく広範な事例研究を行い,すべての開発ツールを体系的に適用した。
関連論文リスト
- Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - U-aggregation: Unsupervised Aggregation of Multiple Learning Algorithms [4.871473117968554]
新人口の強化とロバスト化のための教師なしモデルアグリゲーション手法U-アグリゲーションを提案する。
既存の教師付きモデルアグリゲーションや超学習者アプローチとは異なり、U-アグリゲーションは対象人口の観測されたラベルや成果を仮定しない。
複雑な形質の遺伝的リスク予測を高めるために,U凝集を用いた実世界の応用の可能性を示す。
論文 参考訳(メタデータ) (2025-01-30T01:42:51Z) - On Discriminative Probabilistic Modeling for Self-Supervised Representation Learning [85.75164588939185]
本研究では,(マルチモーダル)自己教師型表現学習のデータ予測タスクにおいて,連続領域における識別確率モデルについて検討する。
我々は、自己教師付き表現学習における現在のInfoNCEに基づくコントラスト損失の制限を明らかにするために一般化誤差解析を行う。
MISが要求する条件付き確率密度の和を近似する新しい非パラメトリック手法を提案する。
論文 参考訳(メタデータ) (2024-10-11T18:02:46Z) - Unifying Self-Supervised Clustering and Energy-Based Models [9.3176264568834]
自己教師付き学習と生成モデルとの間には,原則的な関連性を確立する。
シンボル接地問題の単純かつ非自明なインスタンス化に対処するために,我々の解法をニューロシンボリックな枠組みに統合できることが示される。
論文 参考訳(メタデータ) (2023-12-30T04:46:16Z) - Supercharging Imbalanced Data Learning With Energy-based Contrastive
Representation Transfer [72.5190560787569]
コンピュータビジョンにおいて、長い尾のデータセットからの学習は、特に自然画像データセットの繰り返しのテーマである。
本稿では,データ生成機構がラベル条件と特徴分布の間で不変であるメタ分散シナリオを提案する。
これにより、因果データインフレーションの手順を利用してマイノリティクラスの表現を拡大できる。
論文 参考訳(メタデータ) (2020-11-25T00:13:11Z) - Target-Embedding Autoencoders for Supervised Representation Learning [111.07204912245841]
本稿では,対象空間が高次元な純粋教師付き環境における一般化の枠組みを解析する。
我々は、教師付き予測のための目標埋め込みオートエンコーダ(TEA)の一般的なフレームワークのモチベーションと形式化を行い、特徴とターゲットの予測の両方から予測可能なように最適化された中間潜在表現を学習する。
論文 参考訳(メタデータ) (2020-01-23T02:37:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。