論文の概要: Robots and Children that Learn Together : Improving Knowledge Retention by Teaching Peer-Like Interactive Robots
- arxiv url: http://arxiv.org/abs/2506.18365v1
- Date: Mon, 23 Jun 2025 07:51:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.895958
- Title: Robots and Children that Learn Together : Improving Knowledge Retention by Teaching Peer-Like Interactive Robots
- Title(参考訳): 共に学習するロボットと子ども : ピアライクな対話型ロボットの学習による知識保持の改善
- Authors: Imene Tarakli, Samuele Vinanzi, Richard Moore, Alessandro Di Nuovo,
- Abstract要約: 本研究では,対話型強化学習(Interactive Reinforcement Learning)を,教示可能な社会ロボットの認知モデルとして紹介する。
LbT状態の小児は自己実践状態の児に比べて保持率が高くなった。
本研究は,(1)ピアロボット学習の教育的効果的でスケーラブルなモデルとしてインタラクティブRLを導入し,(2)実教室で複数の自律ロボットを同時に展開する可能性を示した。
- 参考スコア(独自算出の注目度): 41.94295877935867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite growing interest in Learning-by-Teaching (LbT), few studies have explored how this paradigm can be implemented with autonomous, peer-like social robots in real classrooms. Most prior work has relied on scripted or Wizard-of-Oz behaviors, limiting our understanding of how real-time, interactive learning can be supported by artificial agents. This study addresses this gap by introducing Interactive Reinforcement Learning (RL) as a cognitive model for teachable social robots. We conducted two between-subject experiments with 58 primary school children, who either taught a robot or practiced independently on a tablet while learning French vocabulary (memorization) and grammatical rules (inference). The robot, powered by Interactive RL, learned from the child's evaluative feedback. Children in the LbT condition achieved significantly higher retention gains compared to those in the self-practice condition, especially on the grammar task. Learners with lower prior knowledge benefited most from teaching the robot. Behavioural metrics revealed that children adapted their teaching strategies over time and engaged more deeply during inference tasks. This work makes two contributions: (1) it introduces Interactive RL as a pedagogically effective and scalable model for peer-robot learning, and (2) it demonstrates, for the first time, the feasibility of deploying multiple autonomous robots simultaneously in real classrooms. These findings extend theoretical understanding of LbT by showing that social robots can function not only as passive tutees but as adaptive partners that enhance meta-cognitive engagement and long-term learning outcomes.
- Abstract(参考訳): LbT(Learning-by-Teaching)への関心が高まっているにもかかわらず、実際の教室で自律的でピアライクな社会ロボットでこのパラダイムをどのように実装できるかを調査する研究はほとんどない。
これまでのほとんどの作業はスクリプトやWizard-of-Ozの動作に依存しており、リアルタイムでインタラクティブな学習が人工エージェントによってどのようにサポートできるかについての理解を制限しています。
本研究では,対話型強化学習(Interactive Reinforcement Learning, RL)を教育可能な社会ロボットの認知モデルとして導入することで,このギャップを解消する。
我々は,小学生58名を対象に,フランス語の語彙(記憶)と文法の規則(推論)を学習しながら,ロボットを教えたりタブレット上で個別に練習したりした2つの実験を行った。
このロボットは、Interactive RLを使って、子供の評価フィードバックから学習した。
LbT条件の子どもたちは,特に文法的タスクにおいて,自己実践的条件の子供に比べて,保持率を有意に高めた。
事前知識の低い学習者は、ロボットを教えることの恩恵を受けていた。
行動指標から,子どもは時間とともに指導戦略に適応し,推論作業中により深く関与することが判明した。
本研究は,(1)ピアロボット学習の教育的効果的でスケーラブルなモデルとしてインタラクティブRLを導入し,(2)実教室で複数の自律ロボットを同時に展開する可能性を示した。
これらの知見は、社会的ロボットが受動的タテだけでなく、メタ認知的エンゲージメントと長期学習の成果を高める適応的パートナーとして機能することを示し、LbTの理論的理解を深めた。
関連論文リスト
- SIME: Enhancing Policy Self-Improvement with Modal-level Exploration [49.86173021151849]
自己改善を成功させる鍵は、モーダルレベルの探索とデータ選択である。
ポリシー実行中にモーダルレベルの探索機構を組み込むことで、ロボットはより多様なマルチモーダルインタラクションを生成できる。
シミュレーションベンチマークと実世界実験の両方において,効果的なロボット自己改善の実証に成功した。
論文 参考訳(メタデータ) (2025-05-02T17:13:03Z) - SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。
我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文 参考訳(メタデータ) (2024-10-23T17:42:07Z) - Human-Robot Mutual Learning through Affective-Linguistic Interaction and Differential Outcomes Training [Pre-Print] [0.3811184252495269]
本研究では,感情言語コミュニケーションが人間ロボットの文脈における相互学習にどのように影響するかを検証する。
児童介護のダイナミックスからインスピレーションを得て、私たちの人間とロボットのインタラクションのセットアップは、内部的、ホメオスタティックに制御されたニーズのコミュニケーション方法を学ぶための(シミュレートされた)ロボットで構成されています。
論文 参考訳(メタデータ) (2024-07-01T13:35:08Z) - Advancing Household Robotics: Deep Interactive Reinforcement Learning for Efficient Training and Enhanced Performance [0.0]
強化学習(Reinforcement Learning, RL)は、ロボットが環境と対話することを可能にする重要なロボティクス技術として登場した。
本稿では,Deep Interactive Reinforcement Learningを通じて情報とアドバイスを保存・再利用する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-29T01:46:50Z) - Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot [52.277579221741746]
住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。
人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。
本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
論文 参考訳(メタデータ) (2023-11-09T13:01:21Z) - A Human-Robot Mutual Learning System with Affect-Grounded Language
Acquisition and Differential Outcomes Training [0.1812164955222814]
本稿では,ロボットのホメオスタティックなニーズを識別するための,人間とロボットのインタラクション・セットアップを提案する。
我々は,ロボットが内部ニーズに特有のフィードバックを提供する,差分結果学習プロトコルを採用した。
我々は、DOTが人間の学習効率を高めることができるという証拠を発見し、それによってより効率的なロボット言語習得を可能にした。
論文 参考訳(メタデータ) (2023-10-20T09:41:31Z) - Mimicking the Maestro: Exploring the Efficacy of a Virtual AI Teacher in
Fine Motor Skill Acquisition [3.07176124710244]
運動スキル、特に手書きなどの運動スキルは、学術的な追求や日常生活において重要な役割を担っている。
これらのスキルを効果的に教える伝統的な方法は、時間がかかり、一貫性がない。
我々は,人間の教官の特徴を捉えたAI教師モデルを導入する。
論文 参考訳(メタデータ) (2023-10-16T11:11:43Z) - How Do Human Users Teach a Continual Learning Robot in Repeated
Interactions? [7.193217430660011]
我々は、人間が長期にわたって連続学習ロボットを教える方法を理解するために、連続学習に人間中心のアプローチをとる。
我々は,200のセッションで連続学習ロボットと対話する40名の参加者を対象に,対人調査を行った。
本研究で収集したデータの質的,定量的な分析により,個々の利用者の指導スタイルに有意な差異があることが示唆された。
論文 参考訳(メタデータ) (2023-06-30T20:29:48Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Hierarchical Affordance Discovery using Intrinsic Motivation [69.9674326582747]
本研究では,移動ロボットの価格学習を支援するために,本質的なモチベーションを用いたアルゴリズムを提案する。
このアルゴリズムは、事前にプログラムされたアクションなしで、相互に関連のある価格を自律的に発見し、学習し、適応することができる。
一度学習すると、これらの余裕はアルゴリズムによって様々な困難を伴うタスクを実行するために一連のアクションを計画するために使われる。
論文 参考訳(メタデータ) (2020-09-23T07:18:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。