論文の概要: Subgroup Discovery in MOOCs: A Big Data Application for Describing Different Types of Learners
- arxiv url: http://arxiv.org/abs/2403.05555v1
- Date: Sat, 10 Feb 2024 16:07:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 08:36:53.273102
- Title: Subgroup Discovery in MOOCs: A Big Data Application for Describing Different Types of Learners
- Title(参考訳): MOOCにおけるサブグループ発見: 学習者のタイプ別記述のためのビッグデータアプリケーション
- Authors: J. M. Luna, H. M. Fardoun, F. Padillo, C. Romero, S. Ventura,
- Abstract要約: 本稿では,MapReduceに基づくサブグループ探索手法を用いて,大規模オープンオンラインコース(MOOC)における学習者の種類を分類し,記述することを目的とする。
提案されたサブグループディスカバリアプローチでは、MapReduceのような新たな並列メソッドが、非常に大きなデータセットに対処できると考えている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The aim of this paper is to categorize and describe different types of learners in massive open online courses (MOOCs) by means of a subgroup discovery approach based on MapReduce. The final objective is to discover IF-THEN rules that appear in different MOOCs. The proposed subgroup discovery approach, which is an extension of the well-known FP-Growth algorithm, considers emerging parallel methodologies like MapReduce to be able to cope with extremely large datasets. As an additional feature, the proposal includes a threshold value to denote the number of courses that each discovered rule should satisfy. A post-processing step is also included so redundant subgroups can be removed. The experimental stage is carried out by considering de-identified data from the first year of 16 MITx and HarvardX courses on the edX platform. Experimental results demonstrate that the proposed MapReduce approach outperforms traditional sequential subgroup discovery approaches, achieving a runtime that is almost constant for different courses. Additionally, thanks to the final post-processing step, only interesting and not-redundant rules are discovered, hence reducing the number of subgroups in one or two orders of magnitude. Finally, the discovered subgroups are easily used by courses' instructors not only for descriptive purposes but also for additional tasks such as recommendation or personalization.
- Abstract(参考訳): 本研究の目的は,MapReduceに基づくサブグループ発見手法を用いて,大規模オープンオンラインコース(MOOC)における学習者の種類を分類し,記述することである。
最後の目的は、異なるMOOCに現れるIF-THEN規則を発見することである。
提案されたサブグループ発見アプローチは、よく知られたFP-Growthアルゴリズムの拡張であり、MapReduceのような新しい並列手法が極めて大きなデータセットに対処できると考えている。
追加機能として、提案には、各発見ルールが満たすべきコース数を示すしきい値が含まれている。
後処理のステップも含むので、冗長なサブグループを削除することができる。
実験段階は、EDXプラットフォーム上の16のMITxコースとHarvardXコースの初年度の特定されていないデータを考慮することで行われる。
実験の結果,提案手法は従来の逐次サブグループ発見手法よりも優れており,異なるコースでほぼ一定な実行環境を実現することができることがわかった。
さらに、最後の後処理のステップのおかげで、興味深いルールと非冗長なルールのみが発見され、従って1、2桁のサブグループの数が減少する。
最後に、発見されたサブグループは、説明目的だけでなく、推薦やパーソナライゼーションといった追加のタスクにも、コースのインストラクターが容易に利用できる。
関連論文リスト
- Discover and Mitigate Multiple Biased Subgroups in Image Classifiers [45.96784278814168]
機械学習モデルは、分散データではうまく機能するが、トレーニングデータに不足している偏りのあるサブグループでは失敗することが多い。
この問題に対処するために,分解,解釈,緩和(DIM)を提案する。
提案手法では,画像特徴を複数のサブグループを表す複数のコンポーネントに分解する。
論文 参考訳(メタデータ) (2024-03-19T14:44:54Z) - Towards More Practical Group Activity Detection: A New Benchmark and Model [61.39427407758131]
グループアクティビティ検出(グループアクティビティ検出、英: Group Activity Detection、GAD)は、ビデオにおいて、各グループのメンバを特定し、同時にグループのアクティビティを分類するタスクである。
私たちはCaf'eと呼ばれる新しいデータセットを提示し、より実用的なシナリオとメトリクスを提示します。
また、未知数のグループと潜在グループメンバーを効率的に効率的に扱う新しいGADモデルを提案する。
論文 参考訳(メタデータ) (2023-12-05T16:48:17Z) - Agnostic Multi-Group Active Learning [24.97598179536084]
能動的学習の観点から,この問題の変種を考察し,学習者がコレクションの各分布からどの例をラベル付けするかを判断する権限を付与する。
我々の主な課題は、不一致に基づくアクティブラーニングのような標準的なアクティブラーニング技術が、マルチグループラーニングの目的に直接適用されないことである。
既存のアルゴリズムを改良し、多群学習の非依存的な定式化のための一貫した能動的学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-06-02T21:24:13Z) - The Minority Matters: A Diversity-Promoting Collaborative Metric
Learning Algorithm [154.47590401735323]
CML(Collaborative Metric Learning)は、リコメンデーションシステムにおいて人気のある手法として最近登場した。
本稿では,ユーザが複数のカテゴリの関心を持つ,困難なシナリオに焦点をあてる。
textitDiversity-Promoting Collaborative Metric Learning (DPCML) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-09-30T08:02:18Z) - XCon: Learning with Experts for Fine-grained Category Discovery [4.787507865427207]
本稿では,XCon(Expert-Contrastive Learning)と呼ばれる新しい手法を提案する。
細粒度データセットを用いた実験では,従来の最適手法よりも明らかに改善された性能を示し,本手法の有効性を示した。
論文 参考訳(メタデータ) (2022-08-03T08:03:12Z) - Many Field Packet Classification with Decomposition and Reinforcement
Learning [2.0915988632142275]
多くのフィールドで異なるルールセットのための効率的なデータ構造を構築することにより、スケーラブルな学習ベースのパケット分類エンジンを提案する。
本手法は,フィールドを部分集合に分解し,それらの部分集合上に決定木を分割し,深層強化学習法を用いて構成する。
その結果、SD分解測定値がDI測定値よりも11.5%速く、ランダム2より25%速く、ランダム1より40%速くなっていることがわかった。
論文 参考訳(メタデータ) (2022-05-16T20:24:37Z) - Spacing Loss for Discovering Novel Categories [72.52222295216062]
新たなクラスディスカバリ(NCD)は、マシンラーニングモデルがラベルのないデータからインスタンスを意味的にグループ化する、学習パラダイムである。
まず,ラベル付きデータとラベルなしデータを併用する必要があるかどうかに基づいて,既存のNCD手法を1段階および2段階の手法に特徴付ける。
多次元スケーリングのキューを用いて、潜在空間における分離性を強制する単純で強力な損失関数を考案する。
論文 参考訳(メタデータ) (2022-04-22T09:37:11Z) - Learning What Not to Segment: A New Perspective on Few-Shot Segmentation [63.910211095033596]
近年では、FSS ( few-shot segmentation) が広く開発されている。
本稿では,問題を緩和するための新鮮で直接的な知見を提案する。
提案されたアプローチのユニークな性質を踏まえて、より現実的で挑戦的な設定にまで拡張する。
論文 参考訳(メタデータ) (2022-03-15T03:08:27Z) - Learning Multi-Attention Context Graph for Group-Based Re-Identification [214.84551361855443]
オーバーラップしていないカメラシステムを介して人々のグループを再識別または取得することを学ぶことは、ビデオ監視において重要なアプリケーションです。
本研究では,グループre-idというグループを識別するためのコンテキスト情報の利用を検討する。
本研究では,グループベースリドタスクを同時に処理するグラフニューラルネットワークに基づく新しい統合フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-29T09:57:47Z) - Robust subgroup discovery [0.2578242050187029]
最小記述長原理を用いて最適ロバスト部分群発見の問題を定式化する。
RSDは、良いサブグループリストを見つけ、各イテレーションで最も重要なサブグループが追加されたことを保証します。
我々は,rsdが従来のサブグループ集合発見法を上回っている54のデータセットを,品質とサブグループリストサイズの観点から実証的に示す。
論文 参考訳(メタデータ) (2021-03-25T09:04:13Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。