論文の概要: Conversational Education at Scale: A Multi-LLM Agent Workflow for Procedural Learning and Pedagogic Quality Assessment
- arxiv url: http://arxiv.org/abs/2507.05528v1
- Date: Mon, 07 Jul 2025 22:56:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.442102
- Title: Conversational Education at Scale: A Multi-LLM Agent Workflow for Procedural Learning and Pedagogic Quality Assessment
- Title(参考訳): 大規模会話教育:手続き学習と教育的品質評価のためのマルチLLMエージェントワークフロー
- Authors: Jiahuan Pei, Fanghua Ye, Xin Sun, Wentao Deng, Koen Hindriks, Junxiao Wang,
- Abstract要約: 大規模言語モデル(LLM)は高度な仮想教育者と学習者を持ち、AI4EducationでNLPをブリッジする。
LLMを利用して対話型学習会話をシミュレートするマルチエージェントワークフローWikiHowAgentを提案する。
教師と学習エージェント、対話マネージャ、および評価装置を統合し、手続き的学習を促進し、教育的品質を評価する。
- 参考スコア(独自算出の注目度): 11.527716245790828
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have advanced virtual educators and learners, bridging NLP with AI4Education. Existing work often lacks scalability and fails to leverage diverse, large-scale course content, with limited frameworks for assessing pedagogic quality. To this end, we propose WikiHowAgent, a multi-agent workflow leveraging LLMs to simulate interactive teaching-learning conversations. It integrates teacher and learner agents, an interaction manager, and an evaluator to facilitate procedural learning and assess pedagogic quality. We introduce a dataset of 114,296 teacher-learner conversations grounded in 14,287 tutorials across 17 domains and 727 topics. Our evaluation protocol combines computational and rubric-based metrics with human judgment alignment. Results demonstrate the workflow's effectiveness in diverse setups, offering insights into LLM capabilities across domains. Our datasets and implementations are fully open-sourced.
- Abstract(参考訳): 大規模言語モデル(LLM)は高度な仮想教育者と学習者を持ち、AI4EducationでNLPをブリッジする。
既存の作業はスケーラビリティに欠けることが多く、多種多様な大規模コースコンテンツを活用することができず、教育的品質を評価するためのフレームワークが限られている。
この目的のために,LLMを利用した対話型授業学習会話をシミュレートするマルチエージェントワークフローであるWikiHowAgentを提案する。
教師と学習エージェント、対話マネージャ、および評価装置を統合し、手続き的学習を促進し、教育的品質を評価する。
我々は17のドメインにわたる14,287のチュートリアルと727のトピックに基づいた114,296人の教師と学生の会話のデータセットを紹介した。
評価プロトコルは,人間の判断のアライメントと計算とルーブリックに基づくメトリクスを組み合わせる。
結果は、さまざまな設定でワークフローの有効性を示し、ドメイン間のLLM機能に関する洞察を提供する。
データセットと実装は完全にオープンソースです。
関連論文リスト
- Benchmarking the Pedagogical Knowledge of Large Language Models [4.417539128489408]
本稿では,その教育的知識に基づいて,大規模言語モデルを評価するための新しいデータセットであるThe Pedagogy Benchmarkを紹介する。
これらのベンチマークは、教師のための専門的開発試験から得られた、慎重にキュレートされた質問に基づいて構築されている。
本報告では, 教育的知識に関する質問に対して, 精度が28%から89%の範囲で, 97モデルの結果を報告する。
論文 参考訳(メタデータ) (2025-06-23T14:49:01Z) - LecEval: An Automated Metric for Multimodal Knowledge Acquisition in Multimedia Learning [58.98865450345401]
本稿では,マイアーのマルチメディア学習認知理論に基礎を置く自動計量であるLecEvalを紹介する。
LecEvalは、コンテンツ関連(CR)、表現的明瞭度(EC)、論理構造(LS)、聴取エンゲージメント(AE)の4つのルーリックを用いて効果を評価する
私たちは、50以上のオンラインコースビデオから2000以上のスライドからなる大規模なデータセットをキュレートします。
論文 参考訳(メタデータ) (2025-05-04T12:06:47Z) - EducationQ: Evaluating LLMs' Teaching Capabilities Through Multi-Agent Dialogue Framework [9.76455227840645]
大規模言語モデル(LLM)は、ますます教育ツールとして機能するが、その教育能力を評価することは困難である。
本研究では,動的シナリオをシミュレートして学習能力を効果的に評価するマルチエージェント対話フレームワークであるEducationQを紹介する。
論文 参考訳(メタデータ) (2025-04-21T07:48:20Z) - Simulating Classroom Education with LLM-Empowered Agents [48.26286735827104]
大型言語モデル (LLM) は、様々な知的教育タスクに応用され、教育支援を行っている。
マルチエージェント型教室シミュレーション教育フレームワークSimClassを提案する。
代表的クラスの役割を認識し、自動授業のための新しいクラス制御機構を導入する。
論文 参考訳(メタデータ) (2024-06-27T14:51:07Z) - Experiential Co-Learning of Software-Developing Agents [83.34027623428096]
大規模言語モデル(LLM)は、特にソフトウェア開発において、様々な領域に大きな変化をもたらした。
本稿では,新しいLLM学習フレームワークであるExperiential Co-Learningを紹介する。
実験では、このフレームワークにより、エージェントは、目に見えないソフトウェア開発タスクをより効果的に対処できることを示した。
論文 参考訳(メタデータ) (2023-12-28T13:50:42Z) - Zero-Shot Goal-Directed Dialogue via RL on Imagined Conversations [70.7884839812069]
大規模言語モデル(LLM)は、多くの自然言語タスクに対する強力で一般的な解決策として登場した。
しかしながら、言語生成の最も重要なアプリケーションの多くは対話的であり、エージェントは望ましい結果に達するために相手と話し合わなければならない。
本研究では,そのような目標指向対話に対して,RLでLLMを適応させる新しい手法について検討する。
論文 参考訳(メタデータ) (2023-11-09T18:45:16Z) - Mastering Robot Manipulation with Multimodal Prompts through Pretraining and Multi-task Fine-tuning [49.92517970237088]
我々はマルチモーダルなプロンプトを理解するためにロボットを訓練する問題に取り組む。
このようなタスクは、視覚と言語信号の相互接続と相補性を理解するロボットの能力にとって大きな課題となる。
マルチモーダルプロンプトを用いてロボット操作を行うためのポリシーを学習する効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-14T22:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。