論文の概要: KASER: Knowledge-Aligned Student Error Simulator for Open-Ended Coding Tasks
- arxiv url: http://arxiv.org/abs/2601.06633v1
- Date: Sat, 10 Jan 2026 17:36:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.909795
- Title: KASER: Knowledge-Aligned Student Error Simulator for Open-Ended Coding Tasks
- Title(参考訳): KASER:オープンエンディングコーディングタスクのための知識適応型学生エラーシミュレータ
- Authors: Zhangqi Duan, Nigel Fernandez, Andrew Lan,
- Abstract要約: 我々は,エラーを学生の知識と整合させる新しいアプローチであるKASER(Knowledge-Aligned Students Error Simulator)を提案する。
学生のコード予測の3つの側面を反映したハイブリッド報酬を用いた強化学習に基づく学習手法を提案する。
- 参考スコア(独自算出の注目度): 1.2593978066564901
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-ended tasks, such as coding problems that are common in computer science education, provide detailed insights into student knowledge. However, training large language models (LLMs) to simulate and predict possible student errors in their responses to these problems can be challenging: they often suffer from mode collapse and fail to fully capture the diversity in syntax, style, and solution approach in student responses. In this work, we present KASER (Knowledge-Aligned Student Error Simulator), a novel approach that aligns errors with student knowledge. We propose a training method based on reinforcement learning using a hybrid reward that reflects three aspects of student code prediction: i) code similarity to the ground-truth, ii) error matching, and iii) code prediction diversity. On two real-world datasets, we perform two levels of evaluation and show that: At the per-student-problem pair level, our method outperforms baselines on code and error prediction; at the per-problem level, our method outperforms baselines on error coverage and simulated code diversity.
- Abstract(参考訳): コンピュータサイエンス教育で一般的なコーディング問題のようなオープンエンドタスクは、学生の知識に関する詳細な洞察を提供する。
しかし、これらの問題に対する生徒の反応をシミュレートし予測するために、大きな言語モデル(LLM)を訓練することは困難である。
そこで本研究では,エラーを学生の知識と整合させる新しいアプローチであるKASER(Knowledge-Aligned Students Error Simulator)を提案する。
学生のコード予測の3つの側面を反映したハイブリッド報酬を用いた強化学習に基づく学習手法を提案する。
一 法規に類似するコード
二 エラーマッチング、及び
三 コード予測の多様性
2つの実世界のデータセット上で、我々は2つの評価レベルを実行し、以下の結果を示した。 学生ごとのペアレベルにおいて、私たちのメソッドは、コードとエラー予測のベースラインよりも優れており、プロブレムレベルでは、私たちのメソッドは、エラーカバレッジとシミュレートされたコードの多様性のベースラインよりも優れています。
関連論文リスト
- Readability-Robust Code Summarization via Meta Curriculum Learning [53.44612630063336]
現実の世界では、コードが貧弱な構造や難読化され、モデルのパフォーマンスが著しく低下することが多い。
本稿では,可読性の低いコードに対するコード要約の堅牢性を向上する,新しい微調整手法であるRoFTCodeSumを提案する。
論文 参考訳(メタデータ) (2026-01-09T02:38:24Z) - UCO: A Multi-Turn Interactive Reinforcement Learning Method for Adaptive Teaching with Large Language Models [59.693733170193944]
大規模言語モデル(LLM)は、教育環境において、回答提供者からインテリジェントな家庭教師へとシフトしている。
最近の強化学習アプローチはこの制限に対処するが、2つの重要な課題に直面している。
これらの課題に対処するために一方向認知最適化法(UCO)を提案する。
論文 参考訳(メタデータ) (2025-11-12T01:27:02Z) - Learning to Make MISTAKEs: Modeling Incorrect Student Thinking And Key Errors [58.65143578052761]
本稿では,推論誤りの高品質な合成例を構成する新しい手法であるMISTAKEを提案する。
3つの教育課題において,MISTAKEを評価した結果,(1)誤答のシミュレーションにおいて高い精度が得られた。
論文 参考訳(メタデータ) (2025-10-13T15:10:38Z) - Embracing Imperfection: Simulating Students with Diverse Cognitive Levels Using LLM-based Agents [36.704574105201864]
大規模言語モデル(LLM)は教育に革命をもたらしており、LLMベースのエージェントは学生の振る舞いをシミュレートする上で重要な役割を果たしている。
学生シミュレーションにおける大きな課題は、様々な認知レベルにおける学生の多様な学習パターンをモデル化することである。
論文 参考訳(メタデータ) (2025-05-26T13:48:49Z) - LLM-based Cognitive Models of Students with Misconceptions [55.29525439159345]
本稿では,この2つの要件を満たすためにLLM(Large Language Models)を命令調整できるかどうかを検討する。
真正な学生ソリューションパターンを反映したデータセットを生成する新しいPythonライブラリであるMalAlgoPyを紹介する。
我々の洞察は、AIに基づく学生モデルの理解を高め、効果的な適応学習システムへの道を開く。
論文 参考訳(メタデータ) (2024-10-16T06:51:09Z) - Test Case-Informed Knowledge Tracing for Open-ended Coding Tasks [42.22663501257155]
オープンエンドコーディングタスクは、コンピュータサイエンス教育で一般的である。
応答の正しさのみを分析する伝統的な知識追跡(KT)モデルは、学生のコードから学生の知識のニュアンスを完全に捉えることはできない。
テストケース・インフォームド・ナレッジ・トレーシング・フォー・オープンエンド・コーディング(TIKTOC)は,オープンエンドの学生コードとテストケースを同時に分析・予測するフレームワークである。
論文 参考訳(メタデータ) (2024-09-28T03:13:40Z) - ProtoTransformer: A Meta-Learning Approach to Providing Student Feedback [54.142719510638614]
本稿では,フィードバックを数発の分類として提供するという課題について考察する。
メタラーナーは、インストラクターによるいくつかの例から、新しいプログラミング質問に関する学生のコードにフィードバックを与えるように適応します。
本手法は,第1段階の大学が提供したプログラムコースにおいて,16,000名の学生試験ソリューションに対するフィードバックの提供に成功している。
論文 参考訳(メタデータ) (2021-07-23T22:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。