論文の概要: Systematic Ensemble Model Selection Approach for Educational Data Mining
- arxiv url: http://arxiv.org/abs/2005.06647v1
- Date: Wed, 13 May 2020 22:25:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 13:44:38.511694
- Title: Systematic Ensemble Model Selection Approach for Educational Data Mining
- Title(参考訳): 教育データマイニングのための体系的アンサンブルモデル選択手法
- Authors: MohammadNoor Injadat, Abdallah Moubayed, Ali Bou Nassif, Abdallah
Shami
- Abstract要約: この研究は、コースデリバリの2つの別々の段階において、2つの異なるデータセットを調査し、分析する。
Giniインデックスとp値に基づく体系的なアプローチを提案し、6つの潜在的機械学習アルゴリズムの組み合わせから適切なアンサンブル学習者を選択する。
実験結果から,提案したアンサンブルモデルでは,両データセットのすべての段階で高い精度と低い偽陽性率が得られることがわかった。
- 参考スコア(独自算出の注目度): 8.26773636337474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A plethora of research has been done in the past focusing on predicting
student's performance in order to support their development. Many institutions
are focused on improving the performance and the education quality; and this
can be achieved by utilizing data mining techniques to analyze and predict
students' performance and to determine possible factors that may affect their
final marks. To address this issue, this work starts by thoroughly exploring
and analyzing two different datasets at two separate stages of course delivery
(20 percent and 50 percent respectively) using multiple graphical, statistical,
and quantitative techniques. The feature analysis provides insights into the
nature of the different features considered and helps in the choice of the
machine learning algorithms and their parameters. Furthermore, this work
proposes a systematic approach based on Gini index and p-value to select a
suitable ensemble learner from a combination of six potential machine learning
algorithms. Experimental results show that the proposed ensemble models achieve
high accuracy and low false positive rate at all stages for both datasets.
- Abstract(参考訳): 学生の育成を支援するために,学生の業績を予測することに焦点を当てた研究が過去に数多く行われている。
多くの機関は、成績と教育の質の向上に重点を置いており、これはデータマイニング技術を利用して、生徒のパフォーマンスを分析し予測し、最終点に影響を与える可能性のある要因を決定することで達成できる。
この問題に対処するために、この研究は、複数のグラフィカル、統計学的、定量的手法を使用して、2つの異なるデータセット(それぞれ20%と50%)のコースデリバリの別々の段階で、徹底的に調査し分析することから始まる。
機能分析は、考慮されたさまざまな機能の性質に関する洞察を提供し、機械学習アルゴリズムとそのパラメータの選択に役立ちます。
さらに,Giniインデックスとp値に基づく体系的アプローチを提案し,潜在的機械学習アルゴリズムの6つの組み合わせから適切なアンサンブル学習者を選択する。
実験の結果,両データセットのすべての段階で高い精度と低い偽陽性率が得られることがわかった。
関連論文リスト
- Improving prediction of students' performance in intelligent tutoring systems using attribute selection and ensembles of different multimodal data sources [0.0]
本研究の目的は,Intelligent Tutoring Systemの異なるデータソースを用いて,大学生の学習成績を予測することである。
異なるマルチモーダルソースから40名の学生のデータを収集・前処理した。
論文 参考訳(メタデータ) (2024-02-10T09:31:39Z) - Few-Shot Learning on Graphs: from Meta-learning to Pre-training and
Prompting [56.25730255038747]
この調査は、最近の展開を合成し、比較洞察を提供し、将来の方向性を特定するための取り組みである。
我々は,既存の研究をメタラーニングアプローチ,事前学習アプローチ,ハイブリッドアプローチの3つの主要なファミリーに体系的に分類した。
これらの手法間の関係を解析し,その強みと限界を比較する。
論文 参考訳(メタデータ) (2024-02-02T14:32:42Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - One-Shot Learning as Instruction Data Prospector for Large Language Models [108.81681547472138]
textscNuggetsはワンショット学習を使用して、広範なデータセットから高品質な命令データを選択する。
我々は,textscNuggets がキュレートした例の上位1%による命令チューニングが,データセット全体を用いた従来の手法よりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-12-16T03:33:12Z) - Analyzing the Capabilities of Nature-inspired Feature Selection
Algorithms in Predicting Student Performance [0.0]
本稿では,学生のパフォーマンス予測に使用するアンサンブルアルゴリズムの特徴選択部分において,自然に触発されたアルゴリズムの相対的性能について分析を行った。
その結果,自然に着想を得たアルゴリズムを特徴選択に利用し,従来のMLアルゴリズムを分類に利用することで,予測精度が向上し,特徴セットのサイズを最大65%削減できることがわかった。
論文 参考訳(メタデータ) (2023-08-15T21:18:52Z) - An Empirical Study on Distribution Shift Robustness From the Perspective
of Pre-Training and Data Augmentation [91.62129090006745]
本稿では,事前学習とデータ拡張の観点から分布シフト問題を考察する。
我々は,事前学習とデータ拡張に焦点を当てた,最初の総合的な実証的研究を行った。
論文 参考訳(メタデータ) (2022-05-25T13:04:53Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - A Study of Graph-Based Approaches for Semi-Supervised Time Series
Classification [0.0]
この課題には,時系列間の類似性を評価するための適切な距離測度と,これらの距離に基づいて予測を行う学習方法の2つの側面が関係している。
本稿では,(ソフト)dtwとマトリックスプロファイルを含む4つの異なる距離尺度と,グラフアレン・カーン法とグラフ畳み込みニューラルネットワークを含む4つの半教師付き学習手法について述べる。
以上の結果から,すべての測定方法がデータセット間の精度に大きく変化し,すべての場合において最適な組み合わせが存在しないことが明らかとなった。
論文 参考訳(メタデータ) (2021-04-16T14:57:41Z) - Computational Models for Academic Performance Estimation [21.31653695065347]
本稿では,ディープラーニングと機械学習のアプローチを深く分析し,自動学生のパフォーマンス推定システムの構築について述べる。
主なコントリビューションは、(a)15のコースからなる大規模なデータセット(学術研究のために公開されている)、(b)このデータセットの推定問題に関する統計的分析と改善である。
機能エンジニアリングや論理関数の推論に依存する従来のアプローチとは異なり、我々のアプローチは完全にデータ駆動であり、様々な予測タスクでパフォーマンスが向上する。
論文 参考訳(メタデータ) (2020-09-06T07:31:37Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Multi-split Optimized Bagging Ensemble Model Selection for Multi-class
Educational Data Mining [8.26773636337474]
この研究は、2つの異なる大学における2つの異なる学部のデータセットを分析します。
コース配信の2段階(それぞれ20%と50%)の成績を予測することを目的としている。
論文 参考訳(メタデータ) (2020-06-09T03:22:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。