論文の概要: LLM-Augmented and Fair Machine Learning Framework for University Admission Prediction
- arxiv url: http://arxiv.org/abs/2509.22560v1
- Date: Fri, 26 Sep 2025 16:40:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.589156
- Title: LLM-Augmented and Fair Machine Learning Framework for University Admission Prediction
- Title(参考訳): 大学入学予測のためのLLM強化・公正機械学習フレームワーク
- Authors: Mohammad Abbadi, Yassine Himeur, Shadi Atalla, Dahlia Mansoor, Wathiq Mansoor,
- Abstract要約: この研究は、機械学習、ディープラーニング、および大規模言語モデルテクニックを融合させる包括的なフレームワークを提示している。
2000以上の学生の記録に基づいて、この研究はロジスティック回帰、ナイーブベイズ、ランダムな森林、ディープニューラルネットワーク、そして積み重ねられたアンサンブルをベンチマークした。
フレームワークは解釈可能で、公正を意識し、デプロイ可能である。
- 参考スコア(独自算出の注目度): 3.54340329539693
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Universities face surging applications and heightened expectations for fairness, making accurate admission prediction increasingly vital. This work presents a comprehensive framework that fuses machine learning, deep learning, and large language model techniques to combine structured academic and demographic variables with unstructured text signals. Drawing on more than 2,000 student records, the study benchmarks logistic regression, Naive Bayes, random forests, deep neural networks, and a stacked ensemble. Logistic regression offers a strong, interpretable baseline at 89.5% accuracy, while the stacked ensemble achieves the best performance at 91.0%, with Naive Bayes and random forests close behind. To probe text integration, GPT-4-simulated evaluations of personal statements are added as features, yielding modest gains but demonstrating feasibility for authentic essays and recommendation letters. Transparency is ensured through feature-importance visualizations and fairness audits. The audits reveal a 9% gender gap (67% male vs. 76% female) and an 11% gap by parental education, underscoring the need for continued monitoring. The framework is interpretable, fairness-aware, and deployable.
- Abstract(参考訳): 大学はアプリケーションの急増に直面し、公正性に対する期待が高まっており、正確な入学予測がますます重要になっている。
この研究は、構造化された学術変数と人口統計変数と構造化されていないテキスト信号を組み合わせるために、機械学習、ディープラーニング、および大規模言語モデル技術を融合した包括的なフレームワークを示す。
2000以上の学生の記録に基づいて、この研究はロジスティック回帰、ナイーブベイズ、ランダムな森林、ディープニューラルネットワーク、そして積み重ねられたアンサンブルをベンチマークした。
ロジスティック回帰は89.5%の精度で強く解釈可能なベースラインを提供し、積み重ねられたアンサンブルは91.0%で最高のパフォーマンスを達成し、ネイブベイズとランダムな森は後方にある。
テキスト統合を探索するために、GPT-4による個人文のシミュレーション評価を特徴として追加し、適度な利得を得たが、真正なエッセイやレコメンデーションレターの実現可能性を示した。
透明性は、機能重要度ビジュアライゼーションと公正度監査によって保証される。
調査の結果、男女差は9%(男性67%、女性76%)、親教育11%で、モニタリングの継続の必要性が強調された。
フレームワークは解釈可能で、公平に認識され、デプロイ可能である。
関連論文リスト
- VISION: Robust and Interpretable Code Vulnerability Detection Leveraging Counterfactual Augmentation [6.576811224645293]
グラフニューラルネットワーク(GNN)は、構造的および論理的コード関係をデータ駆動で学習することができる。
GNNは表面的なコード類似性から'spurious'相関を学習することが多い。
我々は、VISIONと呼ばれる堅牢で解釈可能な脆弱性検出のための統一的なフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-26T11:20:39Z) - Beyond classical and contemporary models: a transformative AI framework for student dropout prediction in distance learning using RAG, Prompt engineering, and Cross-modal fusion [0.4369550829556578]
本稿では、ドロップアウト予測を再定義する変換型AIフレームワークを提案する。
フレームワークの精度は89%、F1スコアは0.88で、従来のモデルよりも7%、偽陰性は21%向上している。
論文 参考訳(メタデータ) (2025-07-04T21:41:43Z) - Demographic Attributes Prediction from Speech Using WavLM Embeddings [25.00298717665857]
本稿では, 年齢, 性別, 母語, 教育, 国などの人口動態特性を音声から推定するために, WavLM の特徴に基づく一般的な分類法を提案する。
提案フレームワークは,年齢予測のための平均絶対誤差(MAE)が4.94で,性別分類のための99.81%以上の精度で達成されている。
論文 参考訳(メタデータ) (2025-02-17T16:43:47Z) - VEDIT: Latent Prediction Architecture For Procedural Video Representation Learning [59.68917139718813]
そこで本研究では,市販の冷凍型ビジュアルエンコーダを用いて,予測および手続き計画において,最先端(SoTA)の性能を達成可能であることを示す。
観察されたステップから凍結したクリップレベルの埋め込みを条件付けて、目に見えないステップの動作を予測することで、予測のための堅牢な表現を学習することができる。
論文 参考訳(メタデータ) (2024-10-04T14:52:09Z) - Phrasing for UX: Enhancing Information Engagement through Computational Linguistics and Creative Analytics [0.0]
本研究では,デジタルプラットフォーム上でのテキスト特徴と情報エンゲージメント(IE)の関係について検討する。
計算言語学と分析がユーザインタラクションに与える影響を強調します。
READモデルは、代表性、使いやすさ、影響、分散といった重要な予測要素を定量化するために導入された。
論文 参考訳(メタデータ) (2024-08-23T00:33:47Z) - BAL: Balancing Diversity and Novelty for Active Learning [53.289700543331925]
多様な不確実なデータのバランスをとるために適応的なサブプールを構築する新しいフレームワークであるBalancing Active Learning (BAL)を導入する。
我々のアプローチは、広く認識されているベンチマークにおいて、確立されたすべてのアクティブな学習方法より1.20%優れています。
論文 参考訳(メタデータ) (2023-12-26T08:14:46Z) - Transferring Pre-trained Multimodal Representations with Cross-modal
Similarity Matching [49.730741713652435]
本論文では,大規模な事前学習型マルチモーダルモデルの表現を,小さなターゲットモデルに効果的に転送する手法を提案する。
教師なしトランスファーでは,教師モデルの表現を学習できるクロスモーダル類似性マッチング(CSM)を導入する。
テキストプロンプトをよりよくエンコードするために、入力テキストプロンプトの語彙的曖昧さを軽減するコンテキストベースのプロンプト拡張(CPA)を設計する。
論文 参考訳(メタデータ) (2023-01-07T17:24:11Z) - Learning to Decompose Visual Features with Latent Textual Prompts [140.2117637223449]
視覚言語モデルを改善するために,Decomposed Feature Prompting (DeFo)を提案する。
我々の実証研究は、視覚言語モデルを改善する上でDeFoが重要であることを示している。
論文 参考訳(メタデータ) (2022-10-09T15:40:13Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - A Simple Framework for Contrastive Learning of Visual Representations [116.37752766922407]
本稿では,視覚表現のコントラスト学習のためのシンプルなフレームワークであるSimCLRについて述べる。
我々は,データ拡張の構成が効果的な予測タスクを定義する上で重要な役割を担っていることを示す。
我々は、ImageNet上での自己教師付き半教師付き学習において、従来の手法よりもかなり優れています。
論文 参考訳(メタデータ) (2020-02-13T18:50:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。