論文の概要: MCQ Difficulty Prediction via Modeling Learner Heterogeneity Using Data-Driven Cognitive Profiling
- arxiv url: http://arxiv.org/abs/2605.16290v1
- Date: Mon, 13 Apr 2026 19:18:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.861015
- Title: MCQ Difficulty Prediction via Modeling Learner Heterogeneity Using Data-Driven Cognitive Profiling
- Title(参考訳): データ駆動型認知プロファイリングを用いた学習者不均一性のモデル化によるMCQ難易度予測
- Authors: Dhriti Krishnan, Jaromir Savelka,
- Abstract要約: 本稿では,データ駆動型認知プロファイリングによる理論能力サンプリングを代替するペルソナ駆動型フレームワークを提案する。
潜在クラス分析(LCA)を用いて行動的ペルソナを同定し,各ペルソナに対する応答分布をシミュレートする大規模言語モデル(LLM)を条件とした。
発見されたペルソナは解釈可能であり、なぜアイテムが難しいのかを洞察し、診断アセスメント設計に潜在的に適用できる可能性がある。
- 参考スコア(独自算出の注目度): 0.11458853556386796
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting the difficulty of multiple-choice questions (MCQs) is important for effective assessment, yet current methods typically assume a unimodal student ability distribution, overlooking the heterogeneous nature of student misconceptions. We propose a persona-driven framework that replaces theoretical ability sampling with data-driven cognitive profiling. Using student interactions from the EEDI dataset, we identify behavioral personas via latent class analysis (LCA), then condition a large language model (LLM) to simulate response distributions for each persona. These signals are aggregated with topic context and fed into a Ridge Regression model to predict the item response theory (IRT) difficulty parameter. With five-fold cross-validation, our method improves over a recent baseline (MSE: 0.367 to 0.274; R2: 0.525 to 0.686). The discovered personas are interpretable and offer insights into why items are difficult, with potential applications to diagnostic assessment design.
- Abstract(参考訳): 多重選択質問(MCQ)の難易度を予測することは効果的な評価には重要であるが、現在の手法では、学生の誤解の異種性を見越して、一助学生の能力分布を仮定するのが一般的である。
本稿では,データ駆動型認知プロファイリングによる理論能力サンプリングを代替するペルソナ駆動型フレームワークを提案する。
EEDIデータセットからの学生のインタラクションを用いて、潜在クラス分析(LCA)を介して行動的ペルソナを特定し、次に大きな言語モデル(LLM)を条件に各ペルソナに対する応答分布をシミュレートする。
これらの信号はトピックコンテキストで集約され、アイテム応答理論(IRT)の難易度パラメータを予測するためにリッジ回帰モデルに入力される。
5倍のクロスバリデーションで最近のベースライン(MSE:0.367 - 0.274; R2:0.525 - 0.686)を改良する。
発見されたペルソナは解釈可能であり、なぜアイテムが難しいのかを洞察し、診断アセスメント設計に潜在的に適用できる可能性がある。
関連論文リスト
- Synthetic Student Responses: LLM-Extracted Features for IRT Difficulty Parameter Estimation [0.0]
項目応答理論の難易度パラメータを学生試験なしで正確に推定できるかどうかを検討する。
我々のアプローチは,Large Language Models (LLMs) を用いて抽出した従来の言語特徴と教育的洞察を組み合わせたものである。
数学の質問に対する25万以上の学生回答のデータセットを用いて、予測された難易度パラメータと全く見えない質問の実際の難易度パラメータの約0.78のPearson相関が得られる。
論文 参考訳(メタデータ) (2026-01-18T18:19:13Z) - Reconstructing Item Characteristic Curves using Fine-Tuned Large Language Models [0.0]
本研究では,項目応答理論(IRT)の心理測定特性を暗黙的にモデル化する手法を提案する。
我々は、離散能力記述子で条件付けられた複数の選択質問に対する応答を生成するためにモデルを訓練する。
我々は, IRTパラメーターを推定するために, 学生の能力の関数として正しい応答の確率を再構築し, ICC(synthetic Item Characteristics Curves)を効果的に生成する。
論文 参考訳(メタデータ) (2026-01-05T22:11:41Z) - SMART: Simulated Students Aligned with Item Response Theory for Question Difficulty Prediction [38.7828715471869]
本稿では、シミュレーションされた学生を指導力で整列させる新しい方法SMART(Simulated Students Aligned with IRT)を提案する。
SMARTは、その改善された能力アライメントを活用することで、他の項目の難易度予測手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-07-07T15:41:38Z) - Preference Learning for AI Alignment: a Causal Perspective [55.2480439325792]
私たちはこの問題を因果パラダイムに枠組み化し、永続的な課題を特定するための因果関係の豊富なツールボックスを提供します。
因果推論の文献を継承し、信頼性の高い一般化に必要な重要な仮定を特定する。
そこで本研究では, 因果関係に基づくアプローチがモデルロバスト性をいかに改善するかを, ナイーブ報酬モデルの障害モードを例示する。
論文 参考訳(メタデータ) (2025-06-06T10:45:42Z) - Semi-supervised Clustering Through Representation Learning of Large-scale EHR Data [5.591260685112265]
SCOREは、患者埋め込みを通じて多領域の疾患プロファイルをキャプチャする半教師付き表現学習フレームワークである。
大規模データの計算課題に対処するため、ハイブリッド期待最大化(EM)とガウス変分近似(GVA)アルゴリズムを導入している。
分析の結果,ラベル付きデータの導入により精度が向上し,ラベル不足に対する感度が低下することがわかった。
論文 参考訳(メタデータ) (2025-05-27T05:20:17Z) - Scalable Learning of Item Response Theory Models [48.91265296134559]
項目応答理論(IRT)モデルは、分類データから、$m$テスト項目の遅延困難特性とともに、$n$試験の潜時能力を評価することを目的としている。
我々はこれらのモデルの類似性をロジスティック回帰に利用し、コアセットと呼ばれる小さな重み付き部分集合を用いて正確に近似することができる。
論文 参考訳(メタデータ) (2024-03-01T17:12:53Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Stateful Offline Contextual Policy Evaluation and Learning [88.9134799076718]
我々は、シーケンシャルデータから、政治以外の評価と学習について研究する。
動的パーソナライズされた価格設定などの問題の因果構造を形式化する。
本報告では,本クラスにおけるアウト・オブ・サンプル・ポリシーの性能改善について述べる。
論文 参考訳(メタデータ) (2021-10-19T16:15:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。