論文の概要: Analyzing Human Models that Adapt Online
- arxiv url: http://arxiv.org/abs/2103.05746v1
- Date: Tue, 9 Mar 2021 22:38:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-11 14:43:12.045581
- Title: Analyzing Human Models that Adapt Online
- Title(参考訳): オンラインに適応する人間モデルの分析
- Authors: Andrea Bajcsy, Anand Siththaranjan, Claire J. Tomlin, Anca D. Dragan
- Abstract要約: 予測する人間のモデルは、しばしば人間のデータからパラメータをオンラインに適応する必要がある。
これは、これらのモデルに依存するロボットにとって、これまで無視された安全関連の質問を引き起こします。
ロボットの学習アルゴリズムを,状態が現在のモデルパラメータ推定であり,制御がロボットが観察する人間のデータである動的システムとしてモデル化する。
- 参考スコア(独自算出の注目度): 42.90591111619058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predictive human models often need to adapt their parameters online from
human data. This raises previously ignored safety-related questions for robots
relying on these models such as what the model could learn online and how
quickly could it learn it. For instance, when will the robot have a confident
estimate in a nearby human's goal? Or, what parameter initializations guarantee
that the robot can learn the human's preferences in a finite number of
observations? To answer such analysis questions, our key idea is to model the
robot's learning algorithm as a dynamical system where the state is the current
model parameter estimate and the control is the human data the robot observes.
This enables us to leverage tools from reachability analysis and optimal
control to compute the set of hypotheses the robot could learn in finite time,
as well as the worst and best-case time it takes to learn them. We demonstrate
the utility of our analysis tool in four human-robot domains, including
autonomous driving and indoor navigation.
- Abstract(参考訳): 予測する人間のモデルは、しばしば人間のデータからパラメータをオンラインに適応する必要がある。
このことは、モデルがオンラインで何を学べるか、どのくらい早く学習できるかなど、これらのモデルに依存しているロボットに対して、これまで無視されていた安全性に関する疑問を提起する。
例えば、ロボットが近くの人間の目標に自信を持って見積もるのはいつですか?
あるいは、ロボットが人間の好みを有限数の観察で学習できることを保証するパラメータの初期化は?
このような分析に答えるためには,ロボットの学習アルゴリズムを,現在のモデルパラメータを推定し,ロボットが観測する人間のデータを制御する動的システムとしてモデル化することが重要となる。
これにより、到達可能性分析と最適制御からツールを活用して、ロボットが有限時間で学習できる仮説の集合を計算し、学習に要する最悪かつ最良の時間を計算することができる。
我々は、自動運転と屋内ナビゲーションを含む4つのヒューマンロボットドメインにおける分析ツールの有用性を実証する。
関連論文リスト
- InteRACT: Transformer Models for Human Intent Prediction Conditioned on Robot Actions [7.574421886354134]
InteRACTアーキテクチャは、大規模な人間と人間のデータセットと小さな人間とロボットのデータセットの微細構造に関する条件付き意図予測モデルを事前訓練する。
実世界の協調的なロボット操作タスクについて評価し、条件付きモデルが様々な限界ベースラインよりも改善されていることを示す。
論文 参考訳(メタデータ) (2023-11-21T19:15:17Z) - Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot [52.277579221741746]
住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。
人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。
本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
論文 参考訳(メタデータ) (2023-11-09T13:01:21Z) - SACSoN: Scalable Autonomous Control for Social Navigation [62.59274275261392]
我々は、社会的に邪魔にならないナビゲーションのための政策の訓練方法を開発した。
この反事実的摂動を最小化することにより、共有空間における人間の自然な振る舞いを変えない方法でロボットに行動を促すことができる。
屋内移動ロボットが人間の傍観者と対話する大規模なデータセットを収集する。
論文 参考訳(メタデータ) (2023-06-02T19:07:52Z) - Towards Modeling and Influencing the Dynamics of Human Learning [26.961274302321343]
私たちは、ロボットが持つ影響を理解し、それを活用して人々をよりよく支援し、人間のモデルが現実とより迅速に一致できるようにするための一歩を踏み出します。
我々のキーとなる考え方は、人間の学習を、新しい観察によって人間の内部モデルを進化させる非線形力学系としてモデル化することである。
次に、人間の学習力学モデルをロボット計画問題に組み込むことで、ロボットが人間の学習にどう影響するかを定式化する。
論文 参考訳(メタデータ) (2023-01-02T23:59:45Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - Reasoning about Counterfactuals to Improve Human Inverse Reinforcement
Learning [5.072077366588174]
人間は自然に、観察可能な行動について推論することで、他のエージェントの信念や欲求を推測する。
我々は,ロボットの意思決定に対する学習者の現在の理解を,人間のIRLモデルに組み込むことを提案する。
また,人間が見えない環境下でのロボットの動作を予測しにくいことを推定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-03-03T17:06:37Z) - Dynamically Switching Human Prediction Models for Efficient Planning [32.180808286226075]
ロボットは人間のモデル群にアクセスでき、オンラインで性能計算のトレードオフを評価することができる。
ドライビングシミュレーターを用いた実験では、ロボットが常に最高の人間モデルに匹敵する性能を発揮できることを示した。
論文 参考訳(メタデータ) (2021-03-13T23:48:09Z) - Model Elicitation through Direct Questioning [22.907680615911755]
ロボットが人間のモデルをモデルからローカライズする方法を示す。
ロボットのチームメイトモデルに対する理解を深めるための質問を生成する方法を示す。
論文 参考訳(メタデータ) (2020-11-24T18:17:16Z) - Human Grasp Classification for Reactive Human-to-Robot Handovers [50.91803283297065]
本稿では,ロボットが人間に遭遇するロボットのハンドオーバに対するアプローチを提案する。
対象物をさまざまな手形やポーズで保持する典型的な方法をカバーする,人間の把握データセットを収集する。
本稿では,検出した把握位置と手の位置に応じて人手から対象物を取り出す計画実行手法を提案する。
論文 参考訳(メタデータ) (2020-03-12T19:58:03Z) - Learning Predictive Models From Observation and Interaction [137.77887825854768]
世界との相互作用から予測モデルを学ぶことで、ロボットのようなエージェントが世界がどのように働くかを学ぶことができる。
しかし、複雑なスキルのダイナミクスを捉えるモデルを学ぶことは大きな課題である。
本研究では,人間などの他のエージェントの観察データを用いて,トレーニングセットを増強する手法を提案する。
論文 参考訳(メタデータ) (2019-12-30T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。