論文の概要: Diagnostic Assessment Generation via Combinatorial Search
- arxiv url: http://arxiv.org/abs/2112.11188v1
- Date: Mon, 6 Dec 2021 06:19:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-26 13:18:24.708707
- Title: Diagnostic Assessment Generation via Combinatorial Search
- Title(参考訳): 組合せ探索による診断評価生成
- Authors: Daehan Kim, Hyeonseong Choi, Guik Jung
- Abstract要約: 本稿では,質問集合の汎用的な定式化と,生の問題解決履歴から評価テストを生成する遺伝的手法を提案する。
実験の結果,提案手法はグリーディとランダムなベースラインを大きなマージンで上回ることがわかった。
また,第9学年を対象とした評価試験の質的分析を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Initial assessment tests are crucial in capturing learner knowledge states in
a consistent manner. Aside from crafting questions itself, putting together
relevant problems to form a question sheet is also a time-consuming process. In
this work, we present a generic formulation of question assembly and a genetic
algorithm based method that can generate assessment tests from raw
problem-solving history. First, we estimate the learner-question knowledge
matrix (snapshot). Each matrix element stands for the probability that a
learner correctly answers a specific question. We formulate the task as a
combinatorial search over this snapshot. To ensure representative and
discriminative diagnostic tests, questions are selected (1) that has a low root
mean squared error against the whole question pool and (2) high standard
deviation among learner performances. Experimental results show that the
proposed method outperforms greedy and random baseline by a large margin in one
private dataset and four public datasets. We also performed qualitative
analysis on the generated assessment test for 9th graders, which enjoys good
problem scatterness across the whole 9th grader curriculum and decent
difficulty level distribution.
- Abstract(参考訳): 最初のアセスメントテストは、学習者の知識状態を一貫した方法で捉えるのに不可欠である。
質問そのものを作るだけでなく、関連する問題を組み立てて質問シートを作るのも、時間のかかる作業だ。
本稿では,質問集合の汎用的定式化と,生の問題解決履歴から評価テストを生成する遺伝的アルゴリズムに基づく手法を提案する。
まず,学習者問合せ知識行列(snapshot)を推定する。
各行列要素は、学習者が特定の質問に正しく答える確率を表す。
このスナップショットに対する組合せ探索としてタスクを定式化する。
代表的・差別的な診断テストを保証するため,(1)質問プール全体に対するルート平均二乗誤差が低く,(2)学習者のパフォーマンスの標準偏差が高い質問が選択される。
実験の結果,提案手法は1つのプライベートデータセットと4つのパブリックデータセットにおいて,グリーディとランダムなベースラインを大きなマージンで上回っていることがわかった。
また,第9学年における評価結果の質的分析を行い,第9学年全体の散発性や難易度分布が良好であることを示した。
関連論文リスト
- Optimal Decision Tree and Adaptive Submodular Ranking with Noisy Outcomes [9.321976218862542]
プールベースのアクティブラーニングでは、学習者にラベルのないデータセットが与えられ、データポイントのラベルをクエリすることで未知の仮説を効率的に学習することを目的としている。
これは古典的最適決定木(ODT)問題として定式化できる: テストのセット、仮説のセット、各テストと仮説に対する結果が与えられた場合、我々の目標は、真の仮説を識別する低コストなテスト手順(すなわち決定木)を見つけることである。
本研究では,ODT問題の基本的変種について検討し,実験結果がうるさい場合,さらに一般的な場合であっても検討する。
論文 参考訳(メタデータ) (2023-12-23T21:47:50Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - TQ-Net: Mixed Contrastive Representation Learning For Heterogeneous Test
Questions [18.186909839033017]
テスト質問(TQ)は通常異質でマルチモーダルで、テキストのみを含むものもあれば、リテラル記述以上の情報を含むものもある。
本稿では,2段階の教師なしインスタンスレベルのコントラスト型事前学習法を用いて,従来のテキストのみの表現を改善する。
そして、TQ-Netは、画像の内容と異種データの表現を融合するために提案された。
論文 参考訳(メタデータ) (2023-03-09T10:55:48Z) - Multi-Label Quantification [78.83284164605473]
定量化とは、教師なしデータサンプルにおいて、興味あるクラスの相対周波数の予測子を生成する教師付き学習課題である。
本研究では,その相対頻度をより正確に予測するために,興味あるクラス間の依存関係を活用しようとするクラス有病率値の推定手法を提案する。
論文 参考訳(メタデータ) (2022-11-15T11:29:59Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - Cognitive Diagnosis with Explicit Student Vector Estimation and
Unsupervised Question Matrix Learning [53.79108239032941]
本研究では,DINA の学生ベクトルを推定するための明示的な学生ベクトル推定法を提案する。
また,Q行列を自動的にラベル付けする双方向キャリブレーションアルゴリズム (HBCA) を提案する。
2つの実世界のデータセットによる実験結果から,ESVE-DINAはDINAモデルよりも精度が高く,HBCAによって自動的にラベル付けされたQ行列は,手動でラベル付けしたQ行列に匹敵する性能が得られることが示された。
論文 参考訳(メタデータ) (2022-03-01T03:53:19Z) - Group Testing with Non-identical Infection Probabilities [59.96266198512243]
そこで我々は,集合形成法を用いた適応型グループテストアルゴリズムを開発した。
提案アルゴリズムは, エントロピー下界に近い性能を示す。
論文 参考訳(メタデータ) (2021-08-27T17:53:25Z) - Option Tracing: Beyond Correctness Analysis in Knowledge Tracing [3.1798318618973362]
既存の知識追跡手法を拡張して,学生が選択した質問の正確な選択肢を予測する。
2つの大規模学生応答データセットにおけるオプション追跡手法の性能を定量的に評価した。
論文 参考訳(メタデータ) (2021-04-19T04:28:34Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Discriminative Learning via Adaptive Questioning [6.378513792050356]
本稿では,候補の能力を複数のカテゴリの1つに最適に分類する,適応的な質問列を設計する問題を考察する。
候補の能力は未知のパラメータとしてモデル化され、質問の難易度とともに、s/h が質問に正しく答えられる可能性を決定する。
論文 参考訳(メタデータ) (2020-04-11T16:50:00Z) - R2DE: a NLP approach to estimating IRT parameters of newly generated
questions [3.364554138758565]
R2DEは、質問のテキストを見て、新しく生成された複数の選択の質問を評価することができるモデルである。
特に、各質問の難易度と識別度を推定することができる。
論文 参考訳(メタデータ) (2020-01-21T14:31:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。