論文の概要: KASER: Knowledge-Aligned Student Error Simulator for Open-Ended Coding Tasks
- arxiv url: http://arxiv.org/abs/2601.06633v1
- Date: Sat, 10 Jan 2026 17:36:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.909795
- Title: KASER: Knowledge-Aligned Student Error Simulator for Open-Ended Coding Tasks
- Title(参考訳): KASER:オープンエンディングコーディングタスクのための知識適応型学生エラーシミュレータ
- Authors: Zhangqi Duan, Nigel Fernandez, Andrew Lan,
- Abstract要約: 我々は,エラーを学生の知識と整合させる新しいアプローチであるKASER(Knowledge-Aligned Students Error Simulator)を提案する。
学生のコード予測の3つの側面を反映したハイブリッド報酬を用いた強化学習に基づく学習手法を提案する。
- 参考スコア(独自算出の注目度): 1.2593978066564901
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-ended tasks, such as coding problems that are common in computer science education, provide detailed insights into student knowledge. However, training large language models (LLMs) to simulate and predict possible student errors in their responses to these problems can be challenging: they often suffer from mode collapse and fail to fully capture the diversity in syntax, style, and solution approach in student responses. In this work, we present KASER (Knowledge-Aligned Student Error Simulator), a novel approach that aligns errors with student knowledge. We propose a training method based on reinforcement learning using a hybrid reward that reflects three aspects of student code prediction: i) code similarity to the ground-truth, ii) error matching, and iii) code prediction diversity. On two real-world datasets, we perform two levels of evaluation and show that: At the per-student-problem pair level, our method outperforms baselines on code and error prediction; at the per-problem level, our method outperforms baselines on error coverage and simulated code diversity.
- Abstract(参考訳): コンピュータサイエンス教育で一般的なコーディング問題のようなオープンエンドタスクは、学生の知識に関する詳細な洞察を提供する。
しかし、これらの問題に対する生徒の反応をシミュレートし予測するために、大きな言語モデル(LLM)を訓練することは困難である。
そこで本研究では,エラーを学生の知識と整合させる新しいアプローチであるKASER(Knowledge-Aligned Students Error Simulator)を提案する。
学生のコード予測の3つの側面を反映したハイブリッド報酬を用いた強化学習に基づく学習手法を提案する。
一 法規に類似するコード
二 エラーマッチング、及び
三 コード予測の多様性
2つの実世界のデータセット上で、我々は2つの評価レベルを実行し、以下の結果を示した。 学生ごとのペアレベルにおいて、私たちのメソッドは、コードとエラー予測のベースラインよりも優れており、プロブレムレベルでは、私たちのメソッドは、エラーカバレッジとシミュレートされたコードの多様性のベースラインよりも優れています。
関連論文リスト
- BEAGLE: Behavior-Enforced Agent for Grounded Learner Emulation [16.147318846582298]
オープンエンドの問題解決環境における学生の学習行動のシミュレーションは、教育研究の可能性を秘めている。
しかし、プライバシー上の懸念や縦断的研究のコストが高いため、真正データ収集は困難である。
本稿では、自己制御学習(SRL)理論を新しいアーキテクチャに組み込むことにより、このバイアスに対処する神経象徴的フレームワークBEAGLEを提案する。
論文 参考訳(メタデータ) (2026-02-06T08:05:15Z) - Readability-Robust Code Summarization via Meta Curriculum Learning [53.44612630063336]
現実の世界では、コードが貧弱な構造や難読化され、モデルのパフォーマンスが著しく低下することが多い。
本稿では,可読性の低いコードに対するコード要約の堅牢性を向上する,新しい微調整手法であるRoFTCodeSumを提案する。
論文 参考訳(メタデータ) (2026-01-09T02:38:24Z) - UCO: A Multi-Turn Interactive Reinforcement Learning Method for Adaptive Teaching with Large Language Models [59.693733170193944]
大規模言語モデル(LLM)は、教育環境において、回答提供者からインテリジェントな家庭教師へとシフトしている。
最近の強化学習アプローチはこの制限に対処するが、2つの重要な課題に直面している。
これらの課題に対処するために一方向認知最適化法(UCO)を提案する。
論文 参考訳(メタデータ) (2025-11-12T01:27:02Z) - Learning to Make MISTAKEs: Modeling Incorrect Student Thinking And Key Errors [58.65143578052761]
本稿では,推論誤りの高品質な合成例を構成する新しい手法であるMISTAKEを提案する。
3つの教育課題において,MISTAKEを評価した結果,(1)誤答のシミュレーションにおいて高い精度が得られた。
論文 参考訳(メタデータ) (2025-10-13T15:10:38Z) - Embracing Imperfection: Simulating Students with Diverse Cognitive Levels Using LLM-based Agents [36.704574105201864]
大規模言語モデル(LLM)は教育に革命をもたらしており、LLMベースのエージェントは学生の振る舞いをシミュレートする上で重要な役割を果たしている。
学生シミュレーションにおける大きな課題は、様々な認知レベルにおける学生の多様な学習パターンをモデル化することである。
論文 参考訳(メタデータ) (2025-05-26T13:48:49Z) - Knowledge Tracing in Programming Education Integrating Students' Questions [0.0]
本稿では,学生の質問を活用し,スキル情報を自動的に抽出する知識追跡モデルであるSQKT(Students' Question-based Knowledge Tracing)を紹介する。
実験の結果,難易度が異なる様々なPythonプログラミングコースにおいて,SQKTが生徒の完成度を予測する上で,優れた性能を示した。
SQKTは、コンピュータサイエンス教育における個別の学習ニーズに合わせて教育コンテンツを調整し、適応的な学習システムの設計に使用することができる。
論文 参考訳(メタデータ) (2025-01-22T14:13:40Z) - LLM-based Cognitive Models of Students with Misconceptions [55.29525439159345]
本稿では,この2つの要件を満たすためにLLM(Large Language Models)を命令調整できるかどうかを検討する。
真正な学生ソリューションパターンを反映したデータセットを生成する新しいPythonライブラリであるMalAlgoPyを紹介する。
我々の洞察は、AIに基づく学生モデルの理解を高め、効果的な適応学習システムへの道を開く。
論文 参考訳(メタデータ) (2024-10-16T06:51:09Z) - Test Case-Informed Knowledge Tracing for Open-ended Coding Tasks [42.22663501257155]
オープンエンドコーディングタスクは、コンピュータサイエンス教育で一般的である。
応答の正しさのみを分析する伝統的な知識追跡(KT)モデルは、学生のコードから学生の知識のニュアンスを完全に捉えることはできない。
テストケース・インフォームド・ナレッジ・トレーシング・フォー・オープンエンド・コーディング(TIKTOC)は,オープンエンドの学生コードとテストケースを同時に分析・予測するフレームワークである。
論文 参考訳(メタデータ) (2024-09-28T03:13:40Z) - Estimating Difficulty Levels of Programming Problems with Pre-trained Model [18.92661958433282]
プログラミング問題の難易度は、生徒の適応学習を導く上で不可欠な基準となっている。
テキスト記述とコードの解の例から,各プログラム問題の難易度自動推定の問題を定式化する。
この問題に対処するため,テキストモダリティとコードモダリティの2つの事前学習モデルを統一モデルに分割することを提案する。
論文 参考訳(メタデータ) (2024-06-13T05:38:20Z) - Data-CUBE: Data Curriculum for Instruction-based Sentence Representation
Learning [85.66907881270785]
本稿では,学習用マルチタスクデータの順序を列挙するデータカリキュラム,すなわちData-CUBEを提案する。
タスクレベルでは、タスク間の干渉リスクを最小化するために最適なタスクオーダーを見つけることを目的としている。
インスタンスレベルでは、タスク毎のすべてのインスタンスの難易度を測定し、トレーニングのためにそれらを簡単に微分できるミニバッチに分割します。
論文 参考訳(メタデータ) (2024-01-07T18:12:20Z) - ProtoTransformer: A Meta-Learning Approach to Providing Student Feedback [54.142719510638614]
本稿では,フィードバックを数発の分類として提供するという課題について考察する。
メタラーナーは、インストラクターによるいくつかの例から、新しいプログラミング質問に関する学生のコードにフィードバックを与えるように適応します。
本手法は,第1段階の大学が提供したプログラムコースにおいて,16,000名の学生試験ソリューションに対するフィードバックの提供に成功している。
論文 参考訳(メタデータ) (2021-07-23T22:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。