論文の概要: ConvoLearn: A Dataset of Constructivist Tutor-Student Dialogue
- arxiv url: http://arxiv.org/abs/2601.08950v1
- Date: Tue, 13 Jan 2026 19:40:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.150184
- Title: ConvoLearn: A Dataset of Constructivist Tutor-Student Dialogue
- Title(参考訳): ConvoLearn: 構成型チュータ学習対話のデータセット
- Authors: Mayank Sharma, Roy Pea, Hari Subramonyam,
- Abstract要約: 知識構築理論に基づくデータセットであるConvoLearnを紹介する。
本研究では,中学校地球科学科における1250人の教師と学生の対話の半合成データセットを構築した。
このデータセットのトレーニングは、LLMの振る舞いを知識構築戦略に有意義にシフトさせることを示す。
- 参考スコア(独自算出の注目度): 8.046483715751373
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In educational applications, LLMs exhibit several fundamental pedagogical limitations, such as their tendency to reveal solutions rather than support dialogic learning. We introduce ConvoLearn (https://huggingface.co/datasets/masharma/convolearn ), a dataset grounded in knowledge building theory that operationalizes six core pedagogical dimensions: cognitive engagement, formative assessment, accountability, cultural responsiveness, metacognition, and power dynamics. We construct a semi-synthetic dataset of 1250 tutor-student dialogues (20 turns each) in middle school Earth Science through controlled interactions between human teachers and a simulated student. Using QLoRA, we demonstrate that training on this dataset meaningfully shifts LLM behavior toward knowledge-building strategies. Human evaluation by 31 teachers shows our fine-tuned Mistral 7B (M = 4.10, SD = 1.03) significantly outperforms both its base version (M = 2.59, SD = 1.11) and Claude Sonnet 4.5 (M = 2.87, SD = 1.29) overall. This work establishes a potential framework to guide future development and evaluation of constructivist AI tutors.
- Abstract(参考訳): 教育応用においては、LLMは対話型学習よりも解を明らかにする傾向があるなど、基本的な教育的制約がいくつかある。
ConvoLearn (https://huggingface.co/datasets/masharma/convolearn )は、認知エンゲージメント、形式的アセスメント、説明責任、文化的応答性、メタ認知、パワーダイナミクスの6つの中核的な側面を運用する知識構築理論に基づくデータセットである。
本研究では,中学校地球科学における教師とシミュレーション学生とのインタラクションを制御し,1250人の教師と学生の対話(20回ずつ)を半合成したデータセットを構築した。
QLoRAを用いて、このデータセットのトレーニングはLLMの振る舞いを知識構築戦略に有意義にシフトさせることを実証する。
31人の教師による人間による評価では、微調整されたMistral 7B (M = 4.10, SD = 1.03) はベースバージョン (M = 2.59, SD = 1.11) とClaude Sonnet 4.5 (M = 2.87, SD = 1.29) の両方よりも大幅に優れていた。
この研究は、構成主義者のAI家庭教師の今後の開発と評価を導くための潜在的枠組みを確立する。
関連論文リスト
- PATS: Personality-Aware Teaching Strategies with Large Language Model Tutors [66.56586559631516]
大型言語モデル (LLM) は教育教師としての可能性を秘めている。
しかし、異なる学習戦略は、異なる学生の個性に利益をもたらす。
それにもかかわらず、現在のLLM教育システムは生徒の性格特性を考慮に入れていない。
論文 参考訳(メタデータ) (2026-01-13T10:17:26Z) - EduDial: Constructing a Large-scale Multi-turn Teacher-Student Dialogue Corpus [59.693733170193944]
EduDialは総合的な多ターン教師/学生対話データセットである。
EduDialは345のコアナレッジポイントをカバーし、教師と学生エージェントの対話によって生成された34,250の対話セッションで構成されている。
論文 参考訳(メタデータ) (2025-10-14T18:18:43Z) - Instructional Goal-Aligned Question Generation for Student Evaluation in Virtual Lab Settings: How Closely Do LLMs Actually Align? [2.374216763355153]
本稿では,目標整合型質問生成のための新しいアライメントフレームワークを提案する。
教師-LLM対話による指導目標理解、知識単位と関係分析による研究室理解、認知と教育の意図を構造化するための質問分類学、そして迅速な詳細制御のためのTELeR分類学を統合する。
論文 参考訳(メタデータ) (2025-10-07T19:44:15Z) - TeachLM: Post-Training LLMs for Education Using Authentic Learning Data [4.600044635815686]
TeachLMは、パラメータ効率の良い最先端モデルの微調整を用いた教育に最適化された大きな言語モデルである。
パラメータ効率のよい微調整を用いて,高忠実度合成学生と教師の対話を生成できる真正な学生モデルを構築する。
本評価は,学習データの微調整が会話や教育のパフォーマンスを著しく向上させることを示す。
論文 参考訳(メタデータ) (2025-10-06T17:55:04Z) - From Problem-Solving to Teaching Problem-Solving: Aligning LLMs with Pedagogy using Reinforcement Learning [82.50157695987558]
大規模言語モデル(LLM)は教育を変換することができるが、直接質問応答のための最適化はしばしば効果的な教育を損なう。
オンライン強化学習(RL)に基づくアライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-21T15:00:07Z) - LearnLM: Improving Gemini for Learning [10.128120716981474]
本稿では,Google AI Studio上でLearnLMモデルの生成方法を紹介する。
本稿では,学習シナリオの多様さを鑑みて,専門家がかなり好むLearnLMモデルについて述べる。
論文 参考訳(メタデータ) (2024-12-21T01:34:05Z) - Exploring Knowledge Tracing in Tutor-Student Dialogues using LLMs [49.18567856499736]
本研究では,大規模言語モデル(LLM)が対話学習を支援することができるかどうかを検討する。
我々は,学習者の知識レベルを対話全体にわたって追跡するために,ラベル付きデータに知識追跡(KT)手法を適用した。
我々は,2つの学習対話データセットの実験を行い,従来のKT手法よりも学生の反応の正しさを予測できる新しいLCM-based method LLMKTが優れていることを示す。
論文 参考訳(メタデータ) (2024-09-24T22:31:39Z) - YODA: Teacher-Student Progressive Learning for Language Models [82.0172215948963]
本稿では,教師が指導するプログレッシブ・ラーニング・フレームワークであるYodaを紹介する。
モデルファインチューニングの有効性を向上させるために,教師の教育過程をエミュレートする。
実験の結果, YODAのデータによるLLaMA2のトレーニングにより, SFTは大幅に向上した。
論文 参考訳(メタデータ) (2024-01-28T14:32:15Z) - MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties
Grounded in Math Reasoning Problems [74.73881579517055]
そこで本稿では,一般学生の誤りを表現した大規模言語モデルを用いて,人間教師の対話を生成する枠組みを提案する。
このフレームワークを用いて3kの1対1の教師-学生対話のデータセットであるMathDialを収集する方法について述べる。
論文 参考訳(メタデータ) (2023-05-23T21:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。