論文の概要: Mathematics Teachers Interactions with a Multi-Agent System for Personalized Problem Generation
- arxiv url: http://arxiv.org/abs/2604.12066v1
- Date: Mon, 13 Apr 2026 21:10:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.12621
- Title: Mathematics Teachers Interactions with a Multi-Agent System for Personalized Problem Generation
- Title(参考訳): 個人化問題生成のためのマルチエージェントシステムと数学教師のインタラクション
- Authors: Candace Walkington, Theodora Beauchamp, Fareya Ikram, Merve Koçyiğit Gürbüz, Fangli Xia, Margan Lee, Andrew Lan,
- Abstract要約: 8人の中学校数学教師がこのシステムを用いて212の問題をASSISTmentsで作成し、これらの問題を生徒に割り当てた。
その結果,教師も学生も,問題の現実的文脈の細かなパーソナライズされた要素を修正したいと考えた。
エージェントは問題を書く中で現実主義に関する多くの問題を発見したが、最終版では教師や学生が指摘した現実主義の問題はほとんどなかった。
- 参考スコア(独自算出の注目度): 0.31853760822492566
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models can increasingly adapt educational tasks to learners characteristics. In the present study, we examine a multi-agent teacher-in-the-loop system for personalizing middle school math problems. The teacher enters a base problem and desired topic, the LLM generates the problem, and then four AI agents evaluate the problem using criteria that each specializes in (mathematical accuracy, authenticity, readability, and realism). Eight middle school mathematics teachers created 212 problems in ASSISTments using the system and assigned these problems to their students. We find that both teachers and students wanted to modify the fine-grained personalized elements of the real-world context of the problems, signaling issues with authenticity and fit. Although the agents detected many issues with realism as the problems were being written, there were few realism issues noted by teachers and students in the final versions. Issues with readability and mathematical hallucinations were also somewhat rare. Implications for multi-agent systems for personalization that support teacher control are given.
- Abstract(参考訳): 大規模言語モデルは、学習者の特性に教育的タスクを適応させることができる。
本研究では,中学校数学の問題をパーソナライズするマルチエージェント・イン・ザ・ループシステムについて検討する。
教師は基本問題と所望のトピックを入力し、LLMは問題を発生し、4人のAIエージェントがそれぞれが専門とする基準(数学的正確性、真正性、可読性、リアリズム)を用いて問題を評価する。
8人の中学校数学教師がこのシステムを用いて212の問題をASSISTmentsで作成し、これらの問題を生徒に割り当てた。
教師と学生の両方が、問題の現実的な文脈の細かなパーソナライズされた要素を修正し、真正性と適合性のある問題を信号化したいと考えた。
エージェントは問題を書く中で現実主義に関する多くの問題を発見したが、最終版では教師や学生が指摘した現実主義の問題はほとんどなかった。
可読性や数学的幻覚の問題も稀であった。
教師の指導を支援するパーソナライズのためのマルチエージェントシステムの意味について述べる。
関連論文リスト
- A Multi-Agent Approach to Validate and Refine LLM-Generated Personalized Math Problems [5.687145473906]
本稿では,パーソナライズを反復生成-検証-修正プロセスとして形式化するフレームワークを提案する。
可解性, 現実性, 可読性, 真正性の基準を対象とする, 4つの特殊検証エージェントを用いた。
我々は、人気のあるオンライン数学の宿題プラットフォームであるASSISTmentsから引き出された600の問題の枠組みを評価した。
論文 参考訳(メタデータ) (2026-04-06T20:47:01Z) - Can MLLMs Read Students' Minds? Unpacking Multimodal Error Analysis in Handwritten Math [55.83696908107408]
スクラッチマス(ScratchMath)は,手書き数学のスクラッチワークにおける誤りの説明と分類のための新しいベンチマークである。
本データセットは,中国初等・中等生の1,720個の数学サンプルからなる。
我々は,ScratchMath上での16のMLLMを系統的に評価し,人的専門家に対する顕著な性能差を明らかにした。
論文 参考訳(メタデータ) (2026-03-26T02:57:20Z) - MathAgent: Leveraging a Mixture-of-Math-Agent Framework for Real-World Multimodal Mathematical Error Detection [53.325457460187046]
これらの課題に対処するために設計された新しいMixture-of-Math-AgentフレームワークであるMathAgentを紹介する。
MathAgentはエラー検出を3つのフェーズに分解し、それぞれが特別なエージェントによって処理される。
実世界の教育データに基づいてMathAgentを評価し,誤差ステップ同定の精度を約5%向上した。
論文 参考訳(メタデータ) (2025-03-23T16:25:08Z) - Mathfish: Evaluating Language Model Math Reasoning via Grounding in Educational Curricula [25.549869705051606]
我々は,言語モデル(LM)の数学的能力が,数学コンテンツによって実現されるスキルや概念を識別できるかどうかを検討する。
本研究では,算数問題を評価するためのLMの能力を評価するための2つのタスクを開発する。
LMは、問題に関連する標準をタグ付けして検証し、代わりに、真実に近いが微妙な方法で異なるラベルを予測するのに苦労している。
論文 参考訳(メタデータ) (2024-08-08T05:28:34Z) - Stepwise Verification and Remediation of Student Reasoning Errors with Large Language Model Tutors [78.53699244846285]
大規模言語モデル(LLM)は、高品質なパーソナライズされた教育を全員に拡大する機会を提供する。
LLMは、学生のエラーを正確に検知し、これらのエラーに対するフィードバックを調整するのに苦労する。
教師が学生の誤りを識別し、それに基づいて回答をカスタマイズする現実世界の教育実践に触発され、我々は学生ソリューションの検証に焦点をあてる。
論文 参考訳(メタデータ) (2024-07-12T10:11:40Z) - DiVERT: Distractor Generation with Variational Errors Represented as Text for Math Multiple-choice Questions [42.148511874019256]
算数多重選択問題(MCQ)において,障害の背後にある誤りの解釈可能な表現を学習する新しい変分法であるDiVERTを導入する。
提案手法は,7Bパラメータを持つベース・オープンソース LLM を用いているにもかかわらず,GPT-4o を用いた最先端の手法を下流のイントラクタ生成において上回っていることを示す。
数学教育者による人間評価も行っており、DiVERTが人間による評価に匹敵する品質のエラーラベルを導いていることを発見した。
論文 参考訳(メタデータ) (2024-06-27T17:37:31Z) - MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties
Grounded in Math Reasoning Problems [74.73881579517055]
そこで本稿では,一般学生の誤りを表現した大規模言語モデルを用いて,人間教師の対話を生成する枠組みを提案する。
このフレームワークを用いて3kの1対1の教師-学生対話のデータセットであるMathDialを収集する方法について述べる。
論文 参考訳(メタデータ) (2023-05-23T21:44:56Z) - Neural Multi-Task Learning for Teacher Question Detection in Online
Classrooms [50.19997675066203]
教師の音声記録から質問を自動的に検出するエンドツーエンドのニューラルネットワークフレームワークを構築している。
マルチタスク学習手法を取り入れることで,質問の種類によって意味的関係の理解を深めることが可能となる。
論文 参考訳(メタデータ) (2020-05-16T02:17:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。