論文の概要: Multi-split Optimized Bagging Ensemble Model Selection for Multi-class
Educational Data Mining
- arxiv url: http://arxiv.org/abs/2006.05031v1
- Date: Tue, 9 Jun 2020 03:22:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 15:38:11.401283
- Title: Multi-split Optimized Bagging Ensemble Model Selection for Multi-class
Educational Data Mining
- Title(参考訳): マルチクラス教育データマイニングのためのマルチスリット最適化バグングアンサンブルモデル選択
- Authors: MohammadNoor Injadat, Abdallah Moubayed, Ali Bou Nassif, Abdallah
Shami
- Abstract要約: この研究は、2つの異なる大学における2つの異なる学部のデータセットを分析します。
コース配信の2段階(それぞれ20%と50%)の成績を予測することを目的としている。
- 参考スコア(独自算出の注目度): 8.26773636337474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting students' academic performance has been a research area of
interest in recent years with many institutions focusing on improving the
students' performance and the education quality. The analysis and prediction of
students' performance can be achieved using various data mining techniques.
Moreover, such techniques allow instructors to determine possible factors that
may affect the students' final marks. To that end, this work analyzes two
different undergraduate datasets at two different universities. Furthermore,
this work aims to predict the students' performance at two stages of course
delivery (20% and 50% respectively). This analysis allows for properly choosing
the appropriate machine learning algorithms to use as well as optimize the
algorithms' parameters. Furthermore, this work adopts a systematic multi-split
approach based on Gini index and p-value. This is done by optimizing a suitable
bagging ensemble learner that is built from any combination of six potential
base machine learning algorithms. It is shown through experimental results that
the posited bagging ensemble models achieve high accuracy for the target group
for both datasets.
- Abstract(参考訳): 近年,学生の学業成績の予測は,学生の学業成績や教育品質の向上に焦点をあてた研究分野となっている。
様々なデータマイニング技術を用いて,学生のパフォーマンスの分析と予測を行うことができる。
また、これらの手法により、講師は生徒の最終点に影響を与える可能性のある要因を決定することができる。
この研究は、2つの異なる大学の2つの学部のデータセットを分析します。
さらに,本研究は,コース提供の2段階(20%と50%)で,学生のパフォーマンスを予測することを目的としている。
この分析により、適切な機械学習アルゴリズムを適切に選択し、アルゴリズムのパラメータを最適化することができる。
さらに本研究は,gini指標とp値に基づく体系的マルチスプリットアプローチを採用している。
これは、6つの潜在的なベース機械学習アルゴリズムの組み合わせから構築された適切なバッグアンサンブル学習を最適化することで実現される。
実験結果から, 両データセットの目標群に対して, ポジトバッグングアンサンブルモデルが高い精度を達成できることが示唆された。
関連論文リスト
- Improving prediction of students' performance in intelligent tutoring systems using attribute selection and ensembles of different multimodal data sources [0.0]
本研究の目的は,Intelligent Tutoring Systemの異なるデータソースを用いて,大学生の学習成績を予測することである。
異なるマルチモーダルソースから40名の学生のデータを収集・前処理した。
論文 参考訳(メタデータ) (2024-02-10T09:31:39Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Enhancing Multi-Objective Optimization through Machine Learning-Supported Multiphysics Simulation [1.6685829157403116]
本稿では,訓練,自己最適化,自己組織的代理モデルのための方法論的枠組みを提案する。
シュロゲートモデルを比較的少量のデータで訓練し、基礎となるシミュレーションを正確に近似できることを示す。
論文 参考訳(メタデータ) (2023-09-22T20:52:50Z) - Analyzing the Capabilities of Nature-inspired Feature Selection
Algorithms in Predicting Student Performance [0.0]
本稿では,学生のパフォーマンス予測に使用するアンサンブルアルゴリズムの特徴選択部分において,自然に触発されたアルゴリズムの相対的性能について分析を行った。
その結果,自然に着想を得たアルゴリズムを特徴選択に利用し,従来のMLアルゴリズムを分類に利用することで,予測精度が向上し,特徴セットのサイズを最大65%削減できることがわかった。
論文 参考訳(メタデータ) (2023-08-15T21:18:52Z) - On the Convergence of Distributed Stochastic Bilevel Optimization
Algorithms over a Network [55.56019538079826]
バイレベル最適化は、幅広い機械学習モデルに適用されている。
既存のアルゴリズムの多くは、分散データを扱うことができないように、シングルマシンの設定を制限している。
そこで我々は,勾配追跡通信機構と2つの異なる勾配に基づく分散二段階最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-06-30T05:29:52Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Generalization in portfolio-based algorithm selection [97.74604695303285]
ポートフォリオベースのアルゴリズム選択に関する最初の証明可能な保証を提供する。
ポートフォリオが大きければ、非常に単純なアルゴリズムセレクタであっても、過剰適合は避けられないことを示す。
論文 参考訳(メタデータ) (2020-12-24T16:33:17Z) - Computational Models for Academic Performance Estimation [21.31653695065347]
本稿では,ディープラーニングと機械学習のアプローチを深く分析し,自動学生のパフォーマンス推定システムの構築について述べる。
主なコントリビューションは、(a)15のコースからなる大規模なデータセット(学術研究のために公開されている)、(b)このデータセットの推定問題に関する統計的分析と改善である。
機能エンジニアリングや論理関数の推論に依存する従来のアプローチとは異なり、我々のアプローチは完全にデータ駆動であり、様々な予測タスクでパフォーマンスが向上する。
論文 参考訳(メタデータ) (2020-09-06T07:31:37Z) - dMelodies: A Music Dataset for Disentanglement Learning [70.90415511736089]
我々は、研究者が様々な領域でアルゴリズムの有効性を実証するのに役立つ新しいシンボリック・ミュージック・データセットを提案する。
これはまた、音楽用に特別に設計されたアルゴリズムを評価する手段を提供する。
データセットは、遠絡学習のためのディープネットワークのトレーニングとテストに十分な大きさ(約13万データポイント)である。
論文 参考訳(メタデータ) (2020-07-29T19:20:07Z) - Systematic Ensemble Model Selection Approach for Educational Data Mining [8.26773636337474]
この研究は、コースデリバリの2つの別々の段階において、2つの異なるデータセットを調査し、分析する。
Giniインデックスとp値に基づく体系的なアプローチを提案し、6つの潜在的機械学習アルゴリズムの組み合わせから適切なアンサンブル学習者を選択する。
実験結果から,提案したアンサンブルモデルでは,両データセットのすべての段階で高い精度と低い偽陽性率が得られることがわかった。
論文 参考訳(メタデータ) (2020-05-13T22:25:58Z) - Three Approaches for Personalization with Applications to Federated
Learning [68.19709953755238]
本稿では,パーソナライゼーションの体系的学習理論について述べる。
学習理論の保証と効率的なアルゴリズムを提供し、その性能を実証する。
全てのアルゴリズムはモデルに依存しず、任意の仮説クラスで機能する。
論文 参考訳(メタデータ) (2020-02-25T01:36:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。