論文の概要: BEAGLE: Behavior-Enforced Agent for Grounded Learner Emulation
- arxiv url: http://arxiv.org/abs/2602.13280v1
- Date: Fri, 06 Feb 2026 08:05:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 12:01:13.610633
- Title: BEAGLE: Behavior-Enforced Agent for Grounded Learner Emulation
- Title(参考訳): BEAGLE:グラウンドドラーナーエミュレーションのための行動強化剤
- Authors: Hanchen David Wang, Clayton Cohn, Zifan Xu, Siyuan Guo, Gautam Biswas, Meiyi Ma,
- Abstract要約: オープンエンドの問題解決環境における学生の学習行動のシミュレーションは、教育研究の可能性を秘めている。
しかし、プライバシー上の懸念や縦断的研究のコストが高いため、真正データ収集は困難である。
本稿では、自己制御学習(SRL)理論を新しいアーキテクチャに組み込むことにより、このバイアスに対処する神経象徴的フレームワークBEAGLEを提案する。
- 参考スコア(独自算出の注目度): 16.147318846582298
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Simulating student learning behaviors in open-ended problem-solving environments holds potential for education research, from training adaptive tutoring systems to stress-testing pedagogical interventions. However, collecting authentic data is challenging due to privacy concerns and the high cost of longitudinal studies. While Large Language Models (LLMs) offer a promising path to student simulation, they suffer from competency bias, optimizing for efficient correctness rather than the erratic, iterative struggle characteristic of novice learners. We present BEAGLE, a neuro-symbolic framework that addresses this bias by incorporating Self-Regulated Learning (SRL) theory into a novel architecture. BEAGLE integrates three key technical innovations: (1) a semi-Markov model that governs the timing and transitions of cognitive behaviors and metacognitive behaviors; (2) Bayesian Knowledge Tracing with explicit flaw injection to enforce realistic knowledge gaps and "unknown unknowns"; and (3) a decoupled agent design that separates high-level strategy use from code generation actions to prevent the model from silently correcting its own intentional errors. In evaluations on Python programming tasks, BEAGLE significantly outperforms state-of-the-art baselines in reproducing authentic trajectories. In a human Turing test, users were unable to distinguish synthetic traces from real student data, achieving an accuracy indistinguishable from random guessing (52.8%).
- Abstract(参考訳): オープンエンドの問題解決環境における学生の学習行動のシミュレーションは、適応型学習システムからストレステスト教育への介入まで、教育研究の可能性を秘めている。
しかし、プライバシー上の懸念や縦断的研究のコストが高いため、真正データ収集は困難である。
大規模言語モデル(LLM)は,学生のシミュレーションに有望な経路を提供するが,能力バイアスに悩まされ,初級学習者の過激で反復的な闘争特性よりも,効率のよい正しさを最適化する。
本稿では、自己制御学習(SRL)理論を新しいアーキテクチャに組み込むことにより、このバイアスに対処する神経象徴的フレームワークBEAGLEを提案する。
BEAGLEは、(1)認知行動とメタ認知行動のタイミングと遷移を管理する半マルコフモデル、(2)現実的な知識ギャップと未知の未知を強制するための明示的な欠陥注入による追跡、(3)高レベルの戦略利用をコード生成行動から切り離し、モデルが静かに意図的な誤りを修正できないようにするための分離されたエージェント設計の3つの重要な技術革新を統合している。
Pythonプログラミングタスクの評価において、BEAGLEは真正軌道の再生において最先端のベースラインを著しく上回っている。
人間のチューリングテストでは、ユーザーは実際の学生データと合成痕跡を区別できず、ランダムな推測(52.8%)と区別できない精度を達成した。
関連論文リスト
- Flexible inference of learning rules from de novo learning data using neural networks [4.396860522241306]
本稿では,Denovo学習タスクにおける行動データから学習ルールを推論する柔軟なフレームワークを提案する。
これらの結果は、実験的なトレーニングプロトコルと行動デジタル双生児の発達を知らせる洞察を与える。
論文 参考訳(メタデータ) (2025-09-04T21:20:11Z) - Dynamic Programming Techniques for Enhancing Cognitive Representation in Knowledge Tracing [125.75923987618977]
認知表現動的プログラミングに基づく知識追跡(CRDP-KT)モデルを提案する。
質問の難易度とそれらの間の性能間隔に基づいて認知表現を最適化する動的プログラミングアルゴリズムである。
これは、その後のモデルトレーニングのためにより正確で体系的な入力機能を提供し、それによって認知状態のシミュレーションにおける歪みを最小限にする。
論文 参考訳(メタデータ) (2025-06-03T14:44:48Z) - Reinforced Interactive Continual Learning via Real-time Noisy Human Feedback [59.768119380109084]
本稿では,AIモデルがリアルタイムフィードバックから新たなスキルを動的に学習する対話型連続学習パラダイムを提案する。
大規模言語モデル(LLM)を活用した強化型対話型連続学習フレームワークRiCLを提案する。
我々のRiCLアプローチは、最先端のオンライン連続学習とノイズラベル学習の既存の組み合わせを大幅に上回っている。
論文 参考訳(メタデータ) (2025-05-15T03:22:03Z) - AdvKT: An Adversarial Multi-Step Training Framework for Knowledge Tracing [64.79967583649407]
知識追跡(KT)は、学生の知識状態を監視し、質問シーケンスに対する反応をシミュレートする。
既存のKTモデルは通常、単一ステップのトレーニングパラダイムに従っており、大きなエラーの蓄積につながる。
本稿では,多段階KTタスクに着目した新しい知識追跡のための多段階学習フレームワーク(AdvKT)を提案する。
論文 参考訳(メタデータ) (2025-04-07T03:31:57Z) - Modeling Behavior Change for Multi-model At-Risk Students Early Prediction (extended version) [10.413751893289056]
現在のモデルは、単純かつ離散的な行動パターンを通じて、一貫してパフォーマンスの悪い学生を識別する。
我々は,中学校の教師の発言データと数値グレードデータを利用した,革新的な予測モデルであるMultimodal-ChangePoint Detection (MCPD)を開発した。
本モデルでは,ベースラインアルゴリズムの平均性能を約5~10%向上させるとともに,70~75%の精度範囲を達成している。
論文 参考訳(メタデータ) (2025-02-19T11:16:46Z) - LLM-based Cognitive Models of Students with Misconceptions [55.29525439159345]
本稿では,この2つの要件を満たすためにLLM(Large Language Models)を命令調整できるかどうかを検討する。
真正な学生ソリューションパターンを反映したデータセットを生成する新しいPythonライブラリであるMalAlgoPyを紹介する。
我々の洞察は、AIに基づく学生モデルの理解を高め、効果的な適応学習システムへの道を開く。
論文 参考訳(メタデータ) (2024-10-16T06:51:09Z) - Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.34904967046097]
継続的な学習は、モデルが以前に学習した情報を忘れてしまう破滅的な忘れ込みの課題を克服しようとする。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れを減らし,新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-15T17:10:51Z) - Practical Edge Detection via Robust Collaborative Learning [11.176517889212015]
エッジ検出は、幅広いビジョン指向タスクのコアコンポーネントである。
目標を達成するためには,2つの重要な問題に対処する必要がある。
非効率なトレーニング済みバックボーンからディープエッジモデルを緩和する方法。
トレーニングデータにおいて、ノイズや間違ったラベルからネガティブな影響を解放する方法。
論文 参考訳(メタデータ) (2023-08-27T12:12:27Z) - Neuro-symbolic model for cantilever beams damage detection [0.0]
本稿では,新しい認知アーキテクチャに基づくカンチレバービームの損傷検出のためのニューロシンボリックモデルを提案する。
ハイブリッド識別モデルはLogic Convolutional Neural Regressorという名称で導入されている。
論文 参考訳(メタデータ) (2023-05-04T13:12:39Z) - IQ-Learn: Inverse soft-Q Learning for Imitation [95.06031307730245]
少数の専門家データからの模倣学習は、複雑な力学を持つ高次元環境では困難である。
行動クローニングは、実装の単純さと安定した収束性のために広く使われている単純な方法である。
本稿では,1つのQ-関数を学習することで,対向学習を回避する動的適応型ILを提案する。
論文 参考訳(メタデータ) (2021-06-23T03:43:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。