論文の概要: Access Timing as Scaffolding: A Reinforcement Learning Approach to GenAI in Education
- arxiv url: http://arxiv.org/abs/2605.15850v1
- Date: Fri, 15 May 2026 11:02:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.260189
- Title: Access Timing as Scaffolding: A Reinforcement Learning Approach to GenAI in Education
- Title(参考訳): スペッフルディングとしてのアクセスタイミング:教育におけるGenAIへの強化学習アプローチ
- Authors: Janne Rotter, Pau Benazet i Montobbio, Davinia Hernández-Leo,
- Abstract要約: 戦略的タイミングのGenAIアクセスは,非制限アクセスと比較して,客観的なポストテスト性能とメタ認知精度を改善した。
これにより、教育者がアクセスタイミングをどのように促進し、人間とAIの学習システム設計に実装するかを探求する新たな研究領域が開かれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, generative AI (GenAI) in educational settings has become ubiquitous in students' daily lives, despite its potential to induce over-reliance, metacognitive disengagement, and diminished learning when used unrestrictedly. While most prior research has thus focused on how to pedagogically scaffold its usage, the question of when to allow off-the-shelf GenAI remains understudied and lacks pedagogically grounded empirical investigation. We treat access timing itself as a form of implicit scaffolding and operationalize it through a reinforcement learning (RL) agent that decides when students should access GenAI, with a reward function grounded in metacognitive theory, cognitive load theory, and productive failure. In a mixed-methods controlled lab study with N=105 participants, we compared the agent's effect on learning gains and metacognitive engagement to unrestricted and fully restricted use. Results show that strategically timed GenAI access under the reinforcement learning condition improved objective post-test performance and metacognitive accuracy compared with unrestricted access, while reducing task errors and time on task relative to complete withholding, all without the need for explicit metacognitive prompts or structured scaffolding. However, no between-condition differences emerged on self-reported metacognitive awareness. Overall, timing of GenAI access therefore is a tractable, theoretically grounded, and scalable pedagogical paradigm that improves over completely unrestricted and withheld access, compatible with off-the-shelf tools and potentially low adoption barrier. This opens up a new research area that explores how access timing can be facilitated by educators and implemented in human-AI learning system design.
- Abstract(参考訳): 近年,教育環境におけるジェネレーティブAI(GenAI)は,過度な信頼感,メタ認知的解離,非制限使用による学習の減少を誘発する可能性にもかかわらず,学生の日常生活に広く普及している。
これまでのほとんどの研究は、その使い方を教育学的に把握する方法に焦点を合わせてきたが、いつ市販のGenAIを許可するかという問題は未検討のままであり、教育学的に根ざした実証研究が欠如している。
我々は、アクセスタイミング自体を暗黙的な足場として扱うとともに、学習者がGenAIにいつアクセスすべきかを判断する強化学習(RL)エージェントを通じて、メタ認知理論、認知負荷理論、生産的失敗に基づく報酬関数を用いて運用する。
N=105人の被験者による混合メソドックス制御実験では、学習の獲得とメタ認知的エンゲージメントに対するエージェントの効果を、制限なく完全に制限された使用と比較した。
その結果、強化学習条件下での戦略的タイミングのGenAIアクセスは、未制限のアクセスと比較して、客観的なポストテストのパフォーマンスとメタ認知精度を向上させる一方で、明確なメタ認知的プロンプトや構造化された足場を必要とせず、タスクエラーとタスク上の時間を削減することができた。
しかし、自己報告されたメタ認知認知に条件差はみられなかった。
全体として、GenAIアクセスのタイミングは、厳格で理論的に基礎があり、スケーラブルな教育パラダイムであり、完全に制限されず、維持されていないアクセスを改善し、既製のツールと互換性があり、採用障壁が低い可能性がある。
これにより、教育者がアクセスタイミングをどのように促進し、人間とAIの学習システム設計に実装するかを探求する新たな研究領域が開かれる。
関連論文リスト
- Teaching Students to Question the Machine: An AI Literacy Intervention Improves Students' Regulation of LLM Use in a Science Task [0.0]
学校における生成的人工知能の急速な採用は、学生のアウトプットへの非クリティカルな依存を懸念させる。
これらのスキルはまだ中学生で開発されており、学生は過信やAI出力の早期受け入れに弱くなっている。
本稿では,2時間のAIリテラシーワークショップが,学生のインタラクション戦略や最終回答の質を向上するかどうかを教室で調査した。
論文 参考訳(メタデータ) (2026-04-02T12:19:43Z) - Exploring Student Perception on Gen AI Adoption in Higher Education: A Descriptive Study [1.978884131103313]
本研究では,学生が生成人工知能(GenAI)をどのように認識し,活用し,評価するかを検討する。
データは、ハートフォードシャー大学の大学院コンピュータサイエンスの学生436名を対象に実施されたアンケートによって収集された。
論文 参考訳(メタデータ) (2026-03-29T17:19:39Z) - Short-Term Gains, Long-Term Gaps: The Impact of GenAI and Search Technologies on Retention [1.534667887016089]
本研究では,認知複雑性の異なるタスクにおいて,GenAI(ChatGPT),検索エンジン(Google),e-textbooksが学生のパフォーマンスに与える影響について検討した。
ChatGPTとGoogleグループは、低次の認知タスクの即時評価において、コントロールグループを上回った。
AI駆動のツールは即時パフォーマンスを促進するが、構造化学習戦略がサポートしない限り、本質的に長期維持を強化するものではない。
論文 参考訳(メタデータ) (2025-07-10T00:44:50Z) - The Agency Gap: How Generative AI Literacy Shapes Independent Writing after AI Support [4.013708138746962]
本研究は,GenAIリテラシーが自己開始と規制を必要とする状況下で,学生の筆記能力を予測する程度について検討する。
文章は洞察力、視覚データ統合、組織、言語的品質、批判的思考などにわたって評価された。
論文 参考訳(メタデータ) (2025-07-06T14:01:06Z) - Evaluating the AI-Lab Intervention: Impact on Student Perception and Use of Generative AI in Early Undergraduate Computer Science Courses [0.0]
Generative AI(GenAI)はコンピュータサイエンス教育に急速に参入しつつある。
形式コースにおける道具使用の指針となる構造的足場の研究のギャップを伴う過信共存に関する懸念。
本研究は,「AI-Lab」の介入が大学生に与える影響について考察する。
論文 参考訳(メタデータ) (2025-04-30T18:12:42Z) - O1 Replication Journey: A Strategic Progress Report -- Part 1 [52.062216849476776]
本稿では,O1 Replication Journeyに具体化された人工知能研究の先駆的アプローチを紹介する。
我々の方法論は、長期化したチームベースのプロジェクトの不規則性を含む、現代のAI研究における重要な課題に対処する。
本稿では,モデルにショートカットだけでなく,完全な探索プロセスの学習を促す旅行学習パラダイムを提案する。
論文 参考訳(メタデータ) (2024-10-08T15:13:01Z) - Autonomous Reinforcement Learning: Formalism and Benchmarking [106.25788536376007]
人間や動物が行うような現実世界の具体的学習は、連続的で非エポゾディックな世界にある。
RLの一般的なベンチマークタスクはエピソジックであり、試行錯誤によってエージェントに複数の試行を行う環境がリセットされる。
この相違は、擬似環境向けに開発されたRLアルゴリズムを現実世界のプラットフォーム上で実行しようとする場合、大きな課題となる。
論文 参考訳(メタデータ) (2021-12-17T16:28:06Z) - Hierarchical Skills for Efficient Exploration [70.62309286348057]
強化学習において、事前訓練された低レベルスキルは、探索を大幅に促進する可能性がある。
下流タスクの以前の知識は、スキルデザインにおける一般性(きめ細かい制御)と特異性(より高速な学習)の適切なバランスをとるために必要である。
教師なしの方法で様々な複雑さのスキルを習得する階層的スキル学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-20T22:29:32Z) - PEBBLE: Feedback-Efficient Interactive Reinforcement Learning via
Relabeling Experience and Unsupervised Pre-training [94.87393610927812]
我々は、フィードバックと非政治学習の両方の長所を生かした、非政治的、インタラクティブな強化学習アルゴリズムを提案する。
提案手法は,従来ヒト・イン・ザ・ループ法で検討されていたよりも複雑度の高いタスクを学習可能であることを実証する。
論文 参考訳(メタデータ) (2021-06-09T14:10:50Z) - Personalized Education in the AI Era: What to Expect Next? [76.37000521334585]
パーソナライズ学習の目的は、学習者の強みに合致する効果的な知識獲得トラックをデザインし、目標を達成するために弱みをバイパスすることである。
近年、人工知能(AI)と機械学習(ML)の隆盛は、パーソナライズされた教育を強化するための新しい視点を広げています。
論文 参考訳(メタデータ) (2021-01-19T12:23:32Z) - Bridging the Imitation Gap by Adaptive Insubordination [88.35564081175642]
教官が特権情報にアクセスして意思決定を行う場合、この情報は模倣学習中に疎外されることを示す。
本稿では,このギャップに対処するため,適応的不規則化(ADVISOR)を提案する。
ADVISORは、トレーニング中の模倣と報酬に基づく強化学習損失を動的に重み付け、模倣と探索をオンザフライで切り替えることを可能にする。
論文 参考訳(メタデータ) (2020-07-23T17:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。