論文の概要: Towards Modeling and Influencing the Dynamics of Human Learning
- arxiv url: http://arxiv.org/abs/2301.00901v1
- Date: Mon, 2 Jan 2023 23:59:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 14:57:08.847012
- Title: Towards Modeling and Influencing the Dynamics of Human Learning
- Title(参考訳): 人間の学習のダイナミクスのモデル化と影響
- Authors: Ran Tian, Masayoshi Tomizuka, Anca Dragan, and Andrea Bajcsy
- Abstract要約: 私たちは、ロボットが持つ影響を理解し、それを活用して人々をよりよく支援し、人間のモデルが現実とより迅速に一致できるようにするための一歩を踏み出します。
我々のキーとなる考え方は、人間の学習を、新しい観察によって人間の内部モデルを進化させる非線形力学系としてモデル化することである。
次に、人間の学習力学モデルをロボット計画問題に組み込むことで、ロボットが人間の学習にどう影響するかを定式化する。
- 参考スコア(独自算出の注目度): 26.961274302321343
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans have internal models of robots (like their physical capabilities), the
world (like what will happen next), and their tasks (like a preferred goal).
However, human internal models are not always perfect: for example, it is easy
to underestimate a robot's inertia. Nevertheless, these models change and
improve over time as humans gather more experience. Interestingly, robot
actions influence what this experience is, and therefore influence how people's
internal models change. In this work we take a step towards enabling robots to
understand the influence they have, leverage it to better assist people, and
help human models more quickly align with reality. Our key idea is to model the
human's learning as a nonlinear dynamical system which evolves the human's
internal model given new observations. We formulate a novel optimization
problem to infer the human's learning dynamics from demonstrations that
naturally exhibit human learning. We then formalize how robots can influence
human learning by embedding the human's learning dynamics model into the robot
planning problem. Although our formulations provide concrete problem
statements, they are intractable to solve in full generality. We contribute an
approximation that sacrifices the complexity of the human internal models we
can represent, but enables robots to learn the nonlinear dynamics of these
internal models. We evaluate our inference and planning methods in a suite of
simulated environments and an in-person user study, where a 7DOF robotic arm
teaches participants to be better teleoperators. While influencing human
learning remains an open problem, our results demonstrate that this influence
is possible and can be helpful in real human-robot interaction.
- Abstract(参考訳): 人間には、ロボットの内部モデル(物理的能力など)、世界(次の出来事のように)、タスク(好みのゴールのような)がある。
しかし、人間の内的モデルは必ずしも完全ではない:例えば、ロボットの慣性を過小評価することは容易である。
それでも、これらのモデルは、人間がより多くの経験を集めるにつれて変化し、改善する。
興味深いことに、ロボットの行動は、この経験に影響を与え、それによって人々の内的モデルの変化に影響を及ぼす。
この作業では、ロボットが持つ影響を理解し、それを活用して人々をよりよく支援し、人間のモデルが現実とより迅速に一致できるようにする。
我々の重要なアイデアは、人間の学習を、新たな観察によって人間の内部モデルを進化させる非線形力学系としてモデル化することである。
自然に人間の学習を提示するデモから人間の学習ダイナミクスを推測するために、新しい最適化問題を定式化する。
次に,ロボット計画問題に人間の学習ダイナミクスモデルを埋め込むことにより,ロボットが人間の学習に影響を与える方法を定式化する。
我々の定式化は具体的な問題ステートメントを提供するが、完全な一般性で解決することは困難である。
我々は、表現できる人間の内部モデルの複雑さを犠牲にする近似に寄与するが、ロボットはこれらの内部モデルの非線形ダイナミクスを学べる。
7DOFロボットアームが参加者により良い遠隔操作者になるよう教える、シミュレーション環境と個人内ユーザスタディのスイートにおける推論と計画手法を評価した。
人間の学習に影響を与えることは依然としてオープンな問題であるが、この影響は可能であり、実際の人間とロボットの相互作用に有効であることを示す。
関連論文リスト
- On the Effect of Robot Errors on Human Teaching Dynamics [1.7249361224827533]
ロボットエラーの存在と重大さが、人間の教示力学の3次元にどのように影響するかを考察する。
結果は、人々はロボットにエラーを教えるのにより多くの時間を費やす傾向があることを示している。
対話型学習のための効果的なインタフェースを設計するための貴重な洞察を提供する。
論文 参考訳(メタデータ) (2024-09-15T19:02:34Z) - HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation [50.616995671367704]
そこで本研究では,人型ロボットが器用な手を備えた,高次元シミュレーション型ロボット学習ベンチマークHumanoidBenchを提案する。
その結果,現在最先端の強化学習アルゴリズムがほとんどのタスクに支障をきたすのに対して,階層的学習アプローチはロバストな低レベルポリシーに支えられた場合,優れた性能を達成できることがわかった。
論文 参考訳(メタデータ) (2024-03-15T17:45:44Z) - SACSoN: Scalable Autonomous Control for Social Navigation [62.59274275261392]
我々は、社会的に邪魔にならないナビゲーションのための政策の訓練方法を開発した。
この反事実的摂動を最小化することにより、共有空間における人間の自然な振る舞いを変えない方法でロボットに行動を促すことができる。
屋内移動ロボットが人間の傍観者と対話する大規模なデータセットを収集する。
論文 参考訳(メタデータ) (2023-06-02T19:07:52Z) - Affordances from Human Videos as a Versatile Representation for Robotics [31.248842798600606]
我々は、人間がどこでどのように対話するかを推定する視覚的余裕モデルを訓練する。
これらの行動割当の構造は、ロボットが多くの複雑なタスクを直接実行できるようにする。
私たちは、VRBと呼ばれる4つの現実世界環境、10以上のタスクと2つのロボットプラットフォームにおいて、私たちのアプローチの有効性を示します。
論文 参考訳(メタデータ) (2023-04-17T17:59:34Z) - Real-World Humanoid Locomotion with Reinforcement Learning [92.85934954371099]
実世界におけるヒューマノイド移動に対する完全学習型アプローチを提案する。
コントローラーは様々な屋外の地形の上を歩けるし、外乱に対して頑丈で、状況に応じて適応できる。
論文 参考訳(メタデータ) (2023-03-06T18:59:09Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - DayDreamer: World Models for Physical Robot Learning [142.11031132529524]
深層強化学習はロボット学習の一般的なアプローチであるが、学習するには大量の試行錯誤が必要となる。
ロボット学習の多くの進歩はシミュレータに依存している。
本稿では,Dreamerを4つのロボットに適用し,シミュレータを使わずに,オンラインおよび実世界で直接学習する。
論文 参考訳(メタデータ) (2022-06-28T17:44:48Z) - Reasoning about Counterfactuals to Improve Human Inverse Reinforcement
Learning [5.072077366588174]
人間は自然に、観察可能な行動について推論することで、他のエージェントの信念や欲求を推測する。
我々は,ロボットの意思決定に対する学習者の現在の理解を,人間のIRLモデルに組み込むことを提案する。
また,人間が見えない環境下でのロボットの動作を予測しにくいことを推定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-03-03T17:06:37Z) - Neuroscience-inspired perception-action in robotics: applying active
inference for state estimation, control and self-perception [2.1067139116005595]
神経科学の発見が、ロボット工学における現在の推定と制御アルゴリズムを改善する機会をいかに開放するかについて議論する。
本稿では,実体プラットフォーム上でのこのような計算モデルの開発から得られた実験と教訓を要約する。
論文 参考訳(メタデータ) (2021-05-10T10:59:38Z) - Dynamically Switching Human Prediction Models for Efficient Planning [32.180808286226075]
ロボットは人間のモデル群にアクセスでき、オンラインで性能計算のトレードオフを評価することができる。
ドライビングシミュレーターを用いた実験では、ロボットが常に最高の人間モデルに匹敵する性能を発揮できることを示した。
論文 参考訳(メタデータ) (2021-03-13T23:48:09Z) - Learning Predictive Models From Observation and Interaction [137.77887825854768]
世界との相互作用から予測モデルを学ぶことで、ロボットのようなエージェントが世界がどのように働くかを学ぶことができる。
しかし、複雑なスキルのダイナミクスを捉えるモデルを学ぶことは大きな課題である。
本研究では,人間などの他のエージェントの観察データを用いて,トレーニングセットを増強する手法を提案する。
論文 参考訳(メタデータ) (2019-12-30T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。