論文の概要: MisEdu-RAG: A Misconception-Aware Dual-Hypergraph RAG for Novice Math Teachers
- arxiv url: http://arxiv.org/abs/2604.04036v1
- Date: Sun, 05 Apr 2026 09:31:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.885261
- Title: MisEdu-RAG: A Misconception-Aware Dual-Hypergraph RAG for Novice Math Teachers
- Title(参考訳): MisEdu-RAG:初等数学教師のための誤解認識型デュアルハイパーグラフRAG
- Authors: Zhihan Guo, Rundong Xue, Yuting Lu, Jionghao Lin,
- Abstract要約: MisEdu-RAGはデュアルハイパーグラフベースの検索拡張生成フレームワークである。
教育的な知識を概念のハイパーグラフとして、実際の学生のミスケースを事例のハイパーグラフとして整理する。
検索された事例と教育原則に根ざした応答を生成する。
- 参考スコア(独自算出の注目度): 2.4382430407654767
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Novice math teachers often encounter students' mistakes that are difficult to diagnose and remediate. Misconceptions are especially challenging because teachers must explain what went wrong and how to solve them. Although many existing large language model (LLM) platforms can assist in generating instructional feedback, these LLMs loosely connect pedagogical knowledge and student mistakes, which might make the guidance less actionable for teachers. To address this gap, we propose MisEdu-RAG, a dual-hypergraph-based retrieval-augmented generation (RAG) framework that organizes pedagogical knowledge as a concept hypergraph and real student mistake cases as an instance hypergraph. Given a query, MisEdu-RAG performs a two-stage retrieval to gather connected evidence from both layers and generates a response grounded in the retrieved cases and pedagogical principles. We evaluate on \textit{MisstepMath}, a dataset of math mistakes paired with teacher solutions, as a benchmark for misconception-aware retrieval and response generation across topics and error types. Evaluation results on \textit{MisstepMath} show that, compared with baseline models, MisEdu-RAG improves token-F1 by 10.95\% and yields up to 15.3\% higher five-dimension response quality, with the largest gains on \textit{Diversity} and \textit{Empowerment}. To verify its applicability in practical use, we further conduct a pilot study through a questionnaire survey of 221 teachers and interviews with 6 novices. The findings suggest that MisEdu-RAG provides diagnosis results and concrete teaching moves for high-demand misconception scenarios. Overall, MisEdu-RAG demonstrates strong potential for scalable teacher training and AI-assisted instruction for misconception handling. Our code is available on GitHub: https://github.com/GEMLab-HKU/MisEdu-RAG.
- Abstract(参考訳): 初心者の数学教師は、診断や修正が難しい生徒の誤りに遭遇することが多い。
何が起きたのか、どのように解決するかを教師が説明しなければならないため、誤解は特に難しい。
既存の大規模言語モデル (LLM) プラットフォームは教育的フィードバックの生成を支援するが、これらのLLMは教育的知識と学生の誤りを緩やかに結び付けるため、教師の指導がより効果的になる可能性がある。
このギャップに対処するために, 教育的知識をハイパーグラフとして整理し, 実際の学生のミスケースをハイパーグラフとして扱う, 二重ハイパーグラフに基づく検索拡張生成(RAG)フレームワークであるMisEdu-RAGを提案する。
クエリが与えられた後、MisEdu-RAGは2段階の検索を行い、両方の層から接続されたエビデンスを収集し、検索されたケースと教育原則に基礎を置いた応答を生成する。
我々は,教師ソリューションと組み合わせた数学ミスのデータセットであるtextit{MisstepMath} を,トピックやエラータイプに対する誤解認識検索と応答生成のベンチマークとして評価した。
textit{MisstepMath} の評価結果は、ベースラインモデルと比較して、MisEdu-RAG はトークン-F1 を 10.95 % 改善し、最大で 15.3 % の高い5次元応答品質が得られ、最大の利益は \textit{Diversity} と \textit{Empowerment} であることを示している。
実運用における適用性を検証するため,221人の教師を対象にしたアンケート調査と6人の初心者へのインタビューを通じて,パイロットテストを実施している。
以上の結果から,MisEdu-RAGは診断結果と,オンデマンドの誤解シナリオに対する具体的指導手段を提供する可能性が示唆された。
全体として、MisEdu-RAGは、スケーラブルな教師訓練と、誤認識処理のためのAI支援指導の強い可能性を示している。
私たちのコードはGitHubで入手可能です。
関連論文リスト
- Can MLLMs Read Students' Minds? Unpacking Multimodal Error Analysis in Handwritten Math [55.83696908107408]
スクラッチマス(ScratchMath)は,手書き数学のスクラッチワークにおける誤りの説明と分類のための新しいベンチマークである。
本データセットは,中国初等・中等生の1,720個の数学サンプルからなる。
我々は,ScratchMath上での16のMLLMを系統的に評価し,人的専門家に対する顕著な性能差を明らかにした。
論文 参考訳(メタデータ) (2026-03-26T02:57:20Z) - The Aftermath of DrawEduMath: Vision Language Models Underperform with Struggling Students and Misdiagnose Errors [15.649331674184433]
我々の研究は、11の視覚言語モデル(VLM)がDrawEduMath上でどのように機能するかを、年間にわたって記録しています。
モデルの弱点は、数学教育の中核的な要素である学生の誤りに集中していることがわかりました。
論文 参考訳(メタデータ) (2026-03-01T05:15:12Z) - Comparing RAG and GraphRAG for Page-Level Retrieval Question Answering on Math Textbook [6.356031718676495]
ラージ言語モデル(LLM)は、学習中の情報検索のための新しい補助具として登場した。
本稿では,知識グラフ強化型RAG手法であるRetrieval-Augmented Generation(RAG)とGraphRAGについて,ページレベルの質問応答について検討する。
論文 参考訳(メタデータ) (2025-09-20T19:06:49Z) - Guiding Through Complexity: What Makes Good Supervision for Hard Math Reasoning Tasks? [74.88417042125985]
複雑さの異なるタスクにおいて、様々な品質レベルで監視データを提供する様々なデータ駆動戦略について検討する。
ハードタスクの監視における結果エラー率が高い場合でも、そのようなデータによるトレーニングは、より簡単なサブタスクの監督を完璧に上回ります。
また,本研究の結果から,タスク・インスペクションとサブタスク・インスペクションを補完することで,顕著なパフォーマンス向上が期待できることがわかった。
論文 参考訳(メタデータ) (2024-10-27T17:55:27Z) - SuperCorrect: Advancing Small LLM Reasoning with Thought Template Distillation and Self-Correction [89.56181323849512]
SuperCorrectは、大きな教師モデルを使用して、より小さな学生モデルの推論と反映の両方を監督し、修正する新しい2段階のフレームワークである。
第1段階では、教師モデルから階層的な高レベルかつ詳細な思考テンプレートを抽出し、よりきめ細かい推論思考を導き出す学生モデルを指導する。
第2段階では、学生モデルの自己補正能力を高めるために、クロスモデル協調直接選好最適化(DPO)を導入する。
論文 参考訳(メタデータ) (2024-10-11T17:25:52Z) - Stepwise Verification and Remediation of Student Reasoning Errors with Large Language Model Tutors [78.53699244846285]
大規模言語モデル(LLM)は、高品質なパーソナライズされた教育を全員に拡大する機会を提供する。
LLMは、学生のエラーを正確に検知し、これらのエラーに対するフィードバックを調整するのに苦労する。
教師が学生の誤りを識別し、それに基づいて回答をカスタマイズする現実世界の教育実践に触発され、我々は学生ソリューションの検証に焦点をあてる。
論文 参考訳(メタデータ) (2024-07-12T10:11:40Z) - Bridging the Novice-Expert Gap via Models of Decision-Making: A Case Study on Remediating Math Mistakes [4.19968291791323]
我々は、認知タスク分析を用いて、専門家の潜在思考プロセスを、修復のための意思決定モデルに変換する。
これには、(A) 学生の誤り、(B) 修復戦略、(C) 反応を生成する前の意図を特定する専門家が含まれる。
我々は,700件の実際の学習談話のデータセットを構築し,その判断に専門家が注釈を付けた。
論文 参考訳(メタデータ) (2023-10-16T17:59:50Z) - MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties
Grounded in Math Reasoning Problems [74.73881579517055]
そこで本稿では,一般学生の誤りを表現した大規模言語モデルを用いて,人間教師の対話を生成する枠組みを提案する。
このフレームワークを用いて3kの1対1の教師-学生対話のデータセットであるMathDialを収集する方法について述べる。
論文 参考訳(メタデータ) (2023-05-23T21:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。