論文の概要: Inducing Individual Students' Learning Strategies through Homomorphic POMDPs
- arxiv url: http://arxiv.org/abs/2403.10930v1
- Date: Sat, 16 Mar 2024 14:06:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-19 20:56:18.255676
- Title: Inducing Individual Students' Learning Strategies through Homomorphic POMDPs
- Title(参考訳): 均質なPOMDPによる個人生徒の学習方略の誘導
- Authors: Huifan Gao, Yifeng Zeng, Yinghui Pan,
- Abstract要約: 複数の認知パターンに対応するため,同相POMDP(H-POMDP)モデルを提案する。
H-POMDPモデルに基づいて、データから異なる認知パターンを表現できる。
我々は、一般的なPOMDP手法と比較して、H-POMDPモデルが複数の認知パターンから混合データをモデル化する際に、より良い精度を示すことを示す実験を行った。
- 参考スコア(独自算出の注目度): 3.388937792941359
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optimizing students' learning strategies is a crucial component in intelligent tutoring systems. Previous research has demonstrated the effectiveness of devising personalized learning strategies for students by modelling their learning processes through partially observable Markov decision process (POMDP). However, the research holds the assumption that the student population adheres to a uniform cognitive pattern. While this assumption simplifies the POMDP modelling process, it evidently deviates from a real-world scenario, thus reducing the precision of inducing individual students' learning strategies. In this article, we propose the homomorphic POMDP (H-POMDP) model to accommodate multiple cognitive patterns and present the parameter learning approach to automatically construct the H-POMDP model. Based on the H-POMDP model, we are able to represent different cognitive patterns from the data and induce more personalized learning strategies for individual students. We conduct experiments to show that, in comparison to the general POMDP approach, the H-POMDP model demonstrates better precision when modelling mixed data from multiple cognitive patterns. Moreover, the learning strategies derived from H-POMDPs exhibit better personalization in the performance evaluation.
- Abstract(参考訳): 生徒の学習戦略の最適化は知的学習システムにおいて重要な要素である。
従来の研究では、部分的に観察可能なマルコフ決定プロセス(POMDP)を通じて学習プロセスをモデル化することで、学生にパーソナライズされた学習戦略を考案する効果を実証している。
しかし,本研究は,学生集団が一様認知パターンに従属すると仮定している。
この仮定はPOMDPモデリングプロセスを単純化するが、これは明らかに現実世界のシナリオから逸脱し、個々の学生の学習戦略を誘導する精度を低下させる。
本稿では,複数の認知パターンに対応する同型POMDP(H-POMDP)モデルを提案し,H-POMDPモデルを自動的に構築するためのパラメータ学習手法を提案する。
H-POMDPモデルに基づいて、データから異なる認知パターンを表現し、個々の学生に対してよりパーソナライズされた学習戦略を導き出すことができる。
我々は、一般的なPOMDP手法と比較して、H-POMDPモデルが複数の認知パターンから混合データをモデル化する際に、より良い精度を示すことを示す実験を行った。
さらに,H-POMDPsから得られた学習戦略は,性能評価においてパーソナライズ性が向上した。
関連論文リスト
- Examining Changes in Internal Representations of Continual Learning Models Through Tensor Decomposition [5.01338577379149]
連続学習(CL)は、逐次学習にまたがる過去の知識の統合を目的としたいくつかの手法の開発を加速させた。
CLモデルのための表現に基づく新しい評価フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-06T07:52:44Z) - Reinforcement Learning with Hidden Markov Models for Discovering
Decision-Making Dynamics [6.582785642715135]
報酬処理異常がMDDの行動マーカーとなる可能性が示唆された。
近年の研究では、単一のRLモデルのみに基づく報酬学習の特徴付けが不十分であることが示唆されている。
本稿では報酬に基づく意思決定を解析するための新しいRL-HMMフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-25T04:03:32Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Multi-Layer Personalized Federated Learning for Mitigating Biases in
Student Predictive Analytics [7.040747348755578]
従来の学習に基づく学生モデリングのアプローチは、データの可用性のバイアスにより、表現不足/マイノリティの学生グループにあまり一般化しない。
本稿では,学生グループ化基準の異なる層にまたがる推論精度を最適化する多層パーソナライズドフェデレーションラーニング(MLPFL)手法を提案する。
論文 参考訳(メタデータ) (2022-12-05T17:27:28Z) - GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP,
and Beyond [101.5329678997916]
対話型意思決定の一般的な枠組みの下で, サンプル高能率強化学習(RL)について検討した。
本稿では,探索とエクスプロイトの基本的なトレードオフを特徴付ける,新しい複雑性尺度である一般化エルダー係数(GEC)を提案する。
低 GEC の RL 問題は非常にリッチなクラスであり、これは低ベルマン楕円体次元問題、双線型クラス、低証人ランク問題、PO-双線型クラス、一般化正規PSR を仮定する。
論文 参考訳(メタデータ) (2022-11-03T16:42:40Z) - The Geometry of Self-supervised Learning Models and its Impact on
Transfer Learning [62.601681746034956]
自己教師型学習(SSL)はコンピュータビジョンにおいて望ましいパラダイムとして登場した。
本稿では,各特徴空間内の局所的近傍を用いて異なるSSLモデルを分析するためのデータ駆動幾何学的手法を提案する。
論文 参考訳(メタデータ) (2022-09-18T18:15:38Z) - Mitigating Biases in Student Performance Prediction via Attention-Based
Personalized Federated Learning [7.040747348755578]
従来の学習に基づく学生モデリングのアプローチは、データの可用性のバイアスにより、表現不足の学生グループにあまり一般化しない。
本研究では,オンライン学習活動から学生のパフォーマンスを予測する手法を提案し,人種や性別などの異なる集団を対象とした推論精度を最適化する。
論文 参考訳(メタデータ) (2022-08-02T00:22:20Z) - Model-free Representation Learning and Exploration in Low-rank MDPs [64.72023662543363]
低位mdpに対して,最初のモデルフリー表現学習アルゴリズムを提案する。
主要なアルゴリズムの貢献は新しいミニマックス表現の学習の目的です。
結果は複雑な環境にスケールする一般的な関数近似を収容できます。
論文 参考訳(メタデータ) (2021-02-14T00:06:54Z) - PAC Bounds for Imitation and Model-based Batch Learning of Contextual
Markov Decision Processes [31.83144400718369]
本稿では,コンテキスト記述子を用いたマルチタスク強化学習のバッチ化の問題点について考察する。
直接政策学習(DPL)、専門家の軌道から学習する模倣学習に基づくアプローチ、モデルに基づく学習という2つの一般的な学習アルゴリズムについて研究する。
論文 参考訳(メタデータ) (2020-06-11T11:57:08Z) - Prototypical Contrastive Learning of Unsupervised Representations [171.3046900127166]
原型コントラスト学習(Prototypeal Contrastive Learning, PCL)は、教師なし表現学習法である。
PCLは暗黙的にデータのセマンティック構造を学習された埋め込み空間にエンコードする。
PCLは、複数のベンチマークで最先端のインスタンスワイド・コントラスト学習法より優れている。
論文 参考訳(メタデータ) (2020-05-11T09:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。