論文の概要: Personalized Auto-Grading and Feedback System for Constructive Geometry Tasks Using Large Language Models on an Online Math Platform
- arxiv url: http://arxiv.org/abs/2509.25529v1
- Date: Mon, 29 Sep 2025 21:35:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.334424
- Title: Personalized Auto-Grading and Feedback System for Constructive Geometry Tasks Using Large Language Models on an Online Math Platform
- Title(参考訳): オンライン数学プラットフォーム上での大規模言語モデルを用いた構成幾何タスクのパーソナライズされたオートグレーディングとフィードバックシステム
- Authors: Yong Oh Lee, Byeonghun Bang, Joohyun Lee, Sejun Oh,
- Abstract要約: 本稿では,構成的幾何タスクのための自動階調とフィードバックシステムを提案する。
このシステムは大規模言語モデル(LLM)を使用して開発され、Algeomathプラットフォーム上にデプロイされた。
- 参考スコア(独自算出の注目度): 3.820691846175567
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As personalized learning gains increasing attention in mathematics education, there is a growing demand for intelligent systems that can assess complex student responses and provide individualized feedback in real time. In this study, we present a personalized auto-grading and feedback system for constructive geometry tasks, developed using large language models (LLMs) and deployed on the Algeomath platform, a Korean online tool designed for interactive geometric constructions. The proposed system evaluates student-submitted geometric constructions by analyzing their procedural accuracy and conceptual understanding. It employs a prompt-based grading mechanism using GPT-4, where student answers and model solutions are compared through a few-shot learning approach. Feedback is generated based on teacher-authored examples built from anticipated student responses, and it dynamically adapts to the student's problem-solving history, allowing up to four iterative attempts per question. The system was piloted with 79 middle-school students, where LLM-generated grades and feedback were benchmarked against teacher judgments. Grading closely aligned with teachers, and feedback helped many students revise errors and complete multi-step geometry tasks. While short-term corrections were frequent, longer-term transfer effects were less clear. Overall, the study highlights the potential of LLMs to support scalable, teacher-aligned formative assessment in mathematics, while pointing to improvements needed in terminology handling and feedback design.
- Abstract(参考訳): 数学教育においてパーソナライズされた学習が注目を集めるにつれて、複雑な学生の反応を評価し、リアルタイムで個別化されたフィードバックを提供するインテリジェントシステムへの需要が高まっている。
本研究では,大規模言語モデル(LLM)を用いて開発され,インタラクティブな幾何学的構成を目的とした韓国のオンラインツールであるAlgeomathプラットフォーム上に展開された,構成的幾何学的タスクのための自動階調・フィードバックシステムについて述べる。
提案システムは,学生が提出した幾何学的構成を,その手続き的精度と概念的理解を分析して評価する。
GPT-4を用いて、学生の回答とモデル解を数ショットの学習アプローチで比較する。
フィードバックは、期待された学生の反応から構築された教師による例に基づいて生成され、生徒の問題解決履歴に動的に適応し、1問につき最大4回の反復的な試みが可能である。
このシステムは、中学生79名を対象に試験を行い、LLM生成の成績とフィードバックを教師の判断に対してベンチマークした。
グラディングは教師と密接に一致し、多くの学生がエラーを修正し、マルチステップの幾何学的タスクを完成させるのに役立った。
短期的修正は頻繁に行われたが、長期的移行効果は明らかではなかった。
全体として、この研究は、LLMが数学におけるスケーラブルで教師に沿った形式的アセスメントをサポートする可能性を強調し、用語処理やフィードバック設計で必要とされる改善を指摘した。
関連論文リスト
- MathEDU: Towards Adaptive Feedback for Student Mathematical Problem-Solving [3.2962799070467432]
本稿では,大規模言語モデル(LLM)の学習者の数学的問題解決プロセスの評価と適応的なフィードバックを提供する能力について考察する。
モデルが学生の事前回答履歴にアクセス可能なシナリオと、コールドスタートコンテキストをシミュレートするシナリオの2つについて、パーソナライズされた学習を支援するモデルの能力を評価する。
論文 参考訳(メタデータ) (2025-05-23T15:59:39Z) - Automated Feedback in Math Education: A Comparative Analysis of LLMs for Open-Ended Responses [0.0]
本研究では,大規模言語モデル(LLM)が数学教育における自動フィードバックを促進する可能性を探究することを目的とする。
我々は,Llamaの数学版であるMistralを採用し,このモデルを用いて,中学校数学問題に対する生徒の回答と教師によるフィードバックのデータセットを活用することによって,学生の反応を評価する。
2人の教師の判断を生かして,評価精度とフィードバックの質を評価する。
論文 参考訳(メタデータ) (2024-10-29T16:57:45Z) - Stepwise Verification and Remediation of Student Reasoning Errors with Large Language Model Tutors [78.53699244846285]
大規模言語モデル(LLM)は、高品質なパーソナライズされた教育を全員に拡大する機会を提供する。
LLMは、学生のエラーを正確に検知し、これらのエラーに対するフィードバックを調整するのに苦労する。
教師が学生の誤りを識別し、それに基づいて回答をカスタマイズする現実世界の教育実践に触発され、我々は学生ソリューションの検証に焦点をあてる。
論文 参考訳(メタデータ) (2024-07-12T10:11:40Z) - Improving the Validity of Automatically Generated Feedback via Reinforcement Learning [46.667783153759636]
強化学習(RL)を用いた正当性と整合性の両方を最適化するフィードバック生成フレームワークを提案する。
具体的には、直接選好最適化(DPO)によるトレーニングのための拡張データセットにおいて、GPT-4のアノテーションを使用してフィードバックペアよりも好みを生成する。
論文 参考訳(メタデータ) (2024-03-02T20:25:50Z) - Empowering Private Tutoring by Chaining Large Language Models [87.76985829144834]
本研究は,最先端の大規模言語モデル(LLM)を活用した,本格的な知的チューリングシステムの開発を探求する。
このシステムは、相互に接続された3つのコアプロセス(相互作用、反射、反応)に分けられる。
各プロセスは LLM ベースのツールと動的に更新されたメモリモジュールによって実装される。
論文 参考訳(メタデータ) (2023-09-15T02:42:03Z) - MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties
Grounded in Math Reasoning Problems [74.73881579517055]
そこで本稿では,一般学生の誤りを表現した大規模言語モデルを用いて,人間教師の対話を生成する枠組みを提案する。
このフレームワークを用いて3kの1対1の教師-学生対話のデータセットであるMathDialを収集する方法について述べる。
論文 参考訳(メタデータ) (2023-05-23T21:44:56Z) - Deep Discourse Analysis for Generating Personalized Feedback in
Intelligent Tutor Systems [4.716555240531893]
ITS(Intelligent Tutoring System)で、自動化されたパーソナライズされたフィードバックの作成を検討します。
我々のゴールは、学生のより優れた学習目標を達成するために、学生の回答の正しい概念と間違った概念を見極めることである。
論文 参考訳(メタデータ) (2021-03-13T20:33:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。