Fugu-MT 論文翻訳(概要): RLTutor: Reinforcement Learning Based Adaptive Tutoring System by Modeling Virtual Student with Fewer Interactions

論文の概要: RLTutor: Reinforcement Learning Based Adaptive Tutoring System by Modeling Virtual Student with Fewer Interactions

arxiv url: http://arxiv.org/abs/2108.00268v1
Date: Sat, 31 Jul 2021 15:42:03 GMT
ステータス: 翻訳完了
システム内更新日: 2021-08-03 15:31:15.028020
Title: RLTutor: Reinforcement Learning Based Adaptive Tutoring System by Modeling Virtual Student with Fewer Interactions
Title（参考訳）: RLTutor:仮想学生と下層相互作用のモデル化による強化学習に基づく適応型チュータシステム
Authors: Yoshiki Kubotani and Yoshihiro Fukuhara and Shigeo Morishima
Abstract要約: 本稿では,学生の仮想モデルを構築し,指導戦略を最適化する枠組みを提案する。この結果は,eラーニングシステムにおける理論的指導最適化と実践的応用のバッファとして機能する。
参考スコア（独自算出の注目度）: 10.34673089426247
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A major challenge in the field of education is providing review schedules that present learned items at appropriate intervals to each student so that memory is retained over time. In recent years, attempts have been made to formulate item reviews as sequential decision-making problems to realize adaptive instruction based on the knowledge state of students. It has been reported previously that reinforcement learning can help realize mathematical models of students learning strategies to maintain a high memory rate. However, optimization using reinforcement learning requires a large number of interactions, and thus it cannot be applied directly to actual students. In this study, we propose a framework for optimizing teaching strategies by constructing a virtual model of the student while minimizing the interaction with the actual teaching target. In addition, we conducted an experiment considering actual instructions using the mathematical model and confirmed that the model performance is comparable to that of conventional teaching methods. Our framework can directly substitute mathematical models used in experiments with human students, and our results can serve as a buffer between theoretical instructional optimization and practical applications in e-learning systems.
Abstract（参考訳）: 教育分野における大きな課題は、学習項目を各学生に適切な間隔で提示し、記憶を時間とともに保持するレビュースケジュールを提供することである。近年,学生の知識状態に基づく適応的指導を実現するために,項目レビューを逐次意思決定問題として定式化することが試みられている。強化学習は,高記憶率を維持するための学習戦略の数学的モデルの実現に役立つことが報告されている。しかし,強化学習による最適化には多数のインタラクションが必要であり,実際の学生には直接適用できない。本研究では,学生の仮想モデルを構築し,実際の指導対象との相互作用を最小限に抑え,指導戦略を最適化する枠組みを提案する。さらに,数理モデルを用いた実際の指示を考慮した実験を行い,モデルの性能が従来の指導法に匹敵することを確認した。本フレームワークは,実験で使用した数理モデルを直接人間の学生に置き換えることができ,e-learningシステムにおける理論指導最適化と実践的応用のバッファーとして機能する。

関連論文リスト

UCO: A Multi-Turn Interactive Reinforcement Learning Method for Adaptive Teaching with Large Language Models [59.693733170193944]
大規模言語モデル(LLM)は、教育環境において、回答提供者からインテリジェントな家庭教師へとシフトしている。最近の強化学習アプローチはこの制限に対処するが、2つの重要な課題に直面している。これらの課題に対処するために一方向認知最適化法(UCO)を提案する。
論文参考訳（メタデータ） (2025-11-12T01:27:02Z)
Bridging the Gap Between Theoretical and Practical Reinforcement Learning in Undergraduate Education [0.0]
提案手法は,従来の講義と対話型ラボベースの学習を統合している。このフレームワークは、OpenAI Gymnasiumのようなシミュレートされた環境を使って、リアルタイムのコーディング演習を通じて学生を巻き込む。
論文参考訳（メタデータ） (2025-09-06T11:37:12Z)
Learning by Teaching: Engaging Students as Instructors of Large Language Models in Computer Science Education [4.088336228217055]
大規模言語モデル(LLM)はコンピュータサイエンス(CS)教育における仮想チューターとしてよく用いられる。本稿では,このモデルを逆転させる新たな教育パラダイムについて述べる。
論文参考訳（メタデータ） (2025-08-08T03:25:19Z)
Adaptive Learning Systems: Personalized Curriculum Design Using LLM-Powered Analytics [14.157213827899342]
大規模言語モデル(LLM)は、個々の学生のニーズに合わせてパーソナライズされた学習体験を可能にすることによって、教育分野に革命をもたらしている。本稿では LLM を利用した分析を応用した適応学習システムのためのフレームワークについて紹介する。
論文参考訳（メタデータ） (2025-07-25T04:36:17Z)
Investigating Pedagogical Teacher and Student LLM Agents: Genetic Adaptation Meets Retrieval Augmented Generation Across Learning Style [16.985943868964394]
効果的な教育には、学生の多様な認知的・行動的プロファイルに対応するために教育戦略を適用する必要がある。本稿では,異種学生エージェントを自己最適化型教師エージェントと統合する新しいシミュレーションフレームワークを提案する。本研究は,データ駆動環境下での人間教育者を訓練するためのテストベッドの提供を目的として,LLMによるシミュレーションの可能性を強調した。
論文参考訳（メタデータ） (2025-05-25T14:45:35Z)
From Problem-Solving to Teaching Problem-Solving: Aligning LLMs with Pedagogy using Reinforcement Learning [76.09281171131941]
大規模言語モデル(LLM)は教育を変換することができるが、直接質問応答のための最適化はしばしば効果的な教育を損なう。オンライン強化学習(RL)に基づくアライメントフレームワークを提案する。
論文参考訳（メタデータ） (2025-05-21T15:00:07Z)
Knowledge Distillation with Training Wheels [15.153745235245287]
授業中に教師から学習する知識蒸留のための,より一般的な枠組みを定式化する。制約付き強化学習を用いてこれを、テストタイム参照として教師モデルを使用するフレームワークに拡張する。
論文参考訳（メタデータ） (2025-02-24T23:17:52Z)
Toward In-Context Teaching: Adapting Examples to Students' Misconceptions [54.82965010592045]
本稿ではAdapTと呼ばれる一連のモデルと評価手法を紹介する。 AToMは、学生の過去の信念を共同で推論し、将来の信念の正しさを最適化する適応教育の新しい確率論的モデルである。本研究は,適応型学習課題の難しさと,それを解決するための学習適応モデルの可能性を両立させるものである。
論文参考訳（メタデータ） (2024-05-07T17:05:27Z)
Revealing Networks: Understanding Effective Teacher Practices in AI-Supported Classrooms using Transmodal Ordered Network Analysis [0.9187505256430948]
本研究は,AI教師と連携した数学教室において,システム内学習の伝統的な指標に関連する効果的な教員の実践を理解するために,トランスモーダル順序ネットワーク分析を用いた。教師の実践を学生の学習率で比較すると,低学率の生徒はモニタリング後,より有意な使用感を示した。学習率の低い生徒は、高学率の学生と同様の学習行動を示し、教師の正しい試みを繰り返した。
論文参考訳（メタデータ） (2023-12-17T21:50:02Z)
RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文参考訳（メタデータ） (2023-11-21T21:05:21Z)
How To Guide Your Learner: Imitation Learning with Active Adaptive Expert Involvement [20.91491585498749]
本稿では,教師と学生のインタラクションモデルに基づく,新しいアクティブな模倣学習フレームワークを提案する。本稿では,AdapMenによるエラー境界の改善と,軽度条件下での複合的エラーの回避について述べる。
論文参考訳（メタデータ） (2023-03-03T16:44:33Z)
Distantly-Supervised Named Entity Recognition with Adaptive Teacher Learning and Fine-grained Student Ensemble [56.705249154629264]
NERモデルの堅牢性を改善するために,自己学習型教員学生フレームワークを提案する。本稿では,2つの教員ネットワークからなる適応型教員学習を提案する。微粒な学生アンサンブルは、教師モデルの各フラグメントを、生徒の対応するフラグメントの時間移動平均で更新し、各モデルフラグメントのノイズに対する一貫した予測を強化する。
論文参考訳（メタデータ） (2022-12-13T12:14:09Z)
Towards a General Pre-training Framework for Adaptive Learning in MOOCs [37.570119583573955]
異種学習要素を適切に活用した,データ観測と学習スタイル分析に基づく統合フレームワークを提案する。授業の構造やテキスト,知識は,学生の非逐次学習行動に本質的に整合性があり,モデリングに有用であることがわかった。
論文参考訳（メタデータ） (2022-07-18T13:18:39Z)
Learning Student-Friendly Teacher Networks for Knowledge Distillation [50.11640959363315]
本研究では,教師から学生への暗黒知識の伝達を容易にする新しい知識蒸留手法を提案する。事前教育を受けた教師に与えた学習モデルの効果的な学習方法のほとんどとは対照的に,学生に親しみやすい教師モデルを学ぶことを目的とする。
論文参考訳（メタデータ） (2021-02-12T07:00:17Z)
A Competence-aware Curriculum for Visual Concepts Learning via Question Answering [95.35905804211698]
本稿では,視覚概念学習のための質問応答型カリキュラムを提案する。視覚概念を学習するためのニューラルシンボリックな概念学習者と学習プロセスを導くための多次元項目応答理論(mIRT)モデルを設計する。 CLEVRの実験結果から,コンピテンスを意識したカリキュラムにより,提案手法は最先端のパフォーマンスを実現することが示された。
論文参考訳（メタデータ） (2020-07-03T05:08:09Z)
Provable Representation Learning for Imitation Learning via Bi-level Optimization [60.059520774789654]
現代の学習システムにおける一般的な戦略は、多くのタスクに有用な表現を学ぶことである。我々は,複数の専門家の軌道が利用できるマルコフ決定過程(MDP)の模倣学習環境において,この戦略を研究する。このフレームワークは,行動のクローン化と観察-アローンの模倣学習設定のためにインスタンス化する。
論文参考訳（メタデータ） (2020-02-24T21:03:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。