論文の概要: An Explainable AI Assistant for Introductory Programming Education: Improving Feedback Reliability with Instructor-AI Collaboration
- arxiv url: http://arxiv.org/abs/2606.12425v1
- Date: Tue, 12 May 2026 06:35:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.886658
- Title: An Explainable AI Assistant for Introductory Programming Education: Improving Feedback Reliability with Instructor-AI Collaboration
- Title(参考訳): 入門プログラミング教育のための説明可能なAIアシスタント:インストラクタ-AIコラボレーションによるフィードバック信頼性の向上
- Authors: Muntasir Hoq, Griffin Pitts, Bradford Mott, Seung Lee, Jessica Vandenberg, Shuyin Jiao, Narges Norouzi, James Lester, Bita Akram,
- Abstract要約: 説明可能なAIモデルを利用して、生徒のコードを分析し、論理的誤りをインストラクターが特定した誤解にマップし、インストラクターが承認したフィードバックを提供する。
以上の結果から,学生に正の体験を育みながら,正確な指導者によるフィードバックを提示できることが示唆された。
- 参考スコア(独自算出の注目度): 6.172982108802445
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Active learning is widely recognized as an effective approach for improving learning outcomes in introductory programming courses. However, insufficient instructional support often limits students' access to timely, personalized feedback, which is crucial for mastering foundational programming concepts. Although recent advances in AI, particularly large language models, offer scalable opportunities for feedback, concerns about explainability and reliability remain. In this paper, we present an AI-driven classroom assistant that leverages an explainable AI model to analyze student code, map logical errors to instructor-identified misconceptions, and deliver instructor-authored feedback, thereby grounding reliability in instructor-defined pedagogical knowledge. To evaluate the effectiveness of our framework, we conducted an expert evaluation to examine its alignment with instructor-verified feedback and deployed the system in a classroom setting to assess students' perceptions of its usability. Results indicate that the assistant can provide accurate, instructor-verified feedback to students while fostering a positive experience.
- Abstract(参考訳): アクティブラーニングは、導入プログラミングコースにおける学習成果を改善するための効果的なアプローチとして広く認識されている。
しかし、教育支援の不十分さは、学生がタイムリーでパーソナライズされたフィードバックにアクセスできることを制限し、基礎的なプログラミング概念を習得するのに不可欠である。
AI、特に大規模言語モデルの最近の進歩は、フィードバックのためのスケーラブルな機会を提供するが、説明可能性や信頼性に関する懸念は残る。
本稿では、説明可能なAIモデルを利用して、生徒のコードを分析し、論理的誤りをインストラクターが特定した誤解にマップし、インストラクターが認可したフィードバックを提供することにより、インストラクターが定義した教育的知識の信頼性を高める。
本フレームワークの有効性を評価するため,教官が検証したフィードバックとの整合性を検討するための専門家評価を行い,学生のユーザビリティに対する認知度を評価するために教室環境に導入した。
以上の結果から,学生に正の体験を育みながら,正確な指導者によるフィードバックを提示できることが示唆された。
関連論文リスト
- Owlgorithm: Supporting Self-Regulated Learning in Competitive Programming through LLM-Driven Reflection [0.0]
競争プログラミング(CP)における自己統制学習(SRL)を支援する教育プラットフォームを提案する。
Owlgorithmは、個々の学生の提出に合わせた、文脈対応のメタプロンプトを生成する。
学生評価とTAフィードバックを探索的に評価した結果,有望なメリットと顕著な制限が認められた。
論文 参考訳(メタデータ) (2025-11-13T05:08:45Z) - Teaching at Scale: Leveraging AI to Evaluate and Elevate Engineering Education [3.557803321422781]
本稿では,大規模言語モデルを用いた定性的な学生フィードバックのためのスケーラブルなAI支援フレームワークを提案する。
このシステムは階層的な要約、匿名化、例外処理を用いて、オープンなコメントから実行可能なテーマを抽出する。
大規模な工学系大学への展開が成功したことを報告します。
論文 参考訳(メタデータ) (2025-08-01T20:27:40Z) - MathTutorBench: A Benchmark for Measuring Open-ended Pedagogical Capabilities of LLM Tutors [82.91830877219822]
我々は、総合的なチューリングモデル評価のためのオープンソースのベンチマークであるMathTutorBenchを紹介する。
MathTutorBenchには、ダイアログベースの教育における科学の研究によって定義された、家庭教師の能力をカバーするデータセットとメトリクスが含まれている。
閉鎖的およびオープンウェイトなモデルの幅広いセットを評価し、問題解決能力によって示される課題の専門知識が、すぐには良い教育に変換されないことを発見した。
論文 参考訳(メタデータ) (2025-02-26T08:43:47Z) - Personalised Feedback Framework for Online Education Programmes Using Generative AI [0.0]
本稿では,埋め込みを組み込むことでChatGPTの機能を拡張したフィードバックフレームワークを提案する。
本研究の一環として,オープンエンドおよび複数選択質問に対する有効率90%と100%を達成できる概念解の証明を提案し,開発した。
論文 参考訳(メタデータ) (2024-10-14T22:35:40Z) - Leveraging Large Language Models for Actionable Course Evaluation Student Feedback to Lecturers [6.161370712594005]
コンピュータサイエンス科の75科以上で742名の学生が回答した。
各コースについて,授業評価項目と動作可能な項目の要約を合成する。
本研究は, 授業環境における教師に対して, 実感的, 行動的, 適切なフィードバックを生み出すために, 生成的AIを使用する可能性を強調した。
論文 参考訳(メタデータ) (2024-07-01T13:29:55Z) - Evaluating and Optimizing Educational Content with Large Language Model Judgments [52.33701672559594]
言語モデル(LM)を教育専門家として活用し,学習結果に対する様々な指導の影響を評価する。
本稿では,一方のLMが他方のLMの判断を報酬関数として利用して命令材料を生成する命令最適化手法を提案する。
ヒトの教師によるこれらのLM生成ワークシートの評価は、LM判定と人間の教師の嗜好との間に有意な整合性を示す。
論文 参考訳(メタデータ) (2024-03-05T09:09:15Z) - Improving the Validity of Automatically Generated Feedback via Reinforcement Learning [46.667783153759636]
強化学習(RL)を用いた正当性と整合性の両方を最適化するフィードバック生成フレームワークを提案する。
具体的には、直接選好最適化(DPO)によるトレーニングのための拡張データセットにおいて、GPT-4のアノテーションを使用してフィードバックペアよりも好みを生成する。
論文 参考訳(メタデータ) (2024-03-02T20:25:50Z) - PapagAI:Automated Feedback for Reflective Essays [48.4434976446053]
ドクティック理論をベースとして,ハイブリッドAIシステムとして実装された,初のオープンソース自動フィードバックツールを提案する。
本研究の主な目的は,学生の学習成果の向上と,講師の指導活動を補完することである。
論文 参考訳(メタデータ) (2023-07-10T11:05:51Z) - Using Large Language Models to Provide Explanatory Feedback to Human
Tutors [3.2507682694499582]
オンライン授業において,教師にリアルタイムフィードバックを提供するための2つのアプローチを提案する。
このワーク・イン・プログレス(英語版)は、効果的な、あるいは努力に基づく修正フィードバックのためのバイナリ分類においてかなりの精度を示す。
より具体的には、大言語モデルに精通した名前付きエンティティ認識を用いた説明的フィードバックを提供するための拡張されたアプローチについて紹介する。
論文 参考訳(メタデータ) (2023-06-27T14:19:12Z) - Modelling Assessment Rubrics through Bayesian Networks: a Pragmatic Approach [40.06500618820166]
本稿では,学習者モデルを直接評価ルーリックから導出する手法を提案する。
本稿では,コンピュータ思考のスキルをテストするために開発された活動の人的評価を自動化するために,この手法を適用する方法について述べる。
論文 参考訳(メタデータ) (2022-09-07T10:09:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。