論文の概要: Quantifying Hypothesis Space Misspecification in Learning from
Human-Robot Demonstrations and Physical Corrections
- arxiv url: http://arxiv.org/abs/2002.00941v2
- Date: Fri, 28 Feb 2020 23:59:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 08:12:25.751179
- Title: Quantifying Hypothesis Space Misspecification in Learning from
Human-Robot Demonstrations and Physical Corrections
- Title(参考訳): 人間のロボットデモと物理補正から学ぶための仮説空間のミススペクションの定量化
- Authors: Andreea Bobu, Andrea Bajcsy, Jaime F. Fisac, Sampada Deglurkar, Anca
D. Dragan
- Abstract要約: 最近の研究は、ロボットがそのようなインプットを使って意図した目的を学習する方法に焦点を当てている。
本研究では,2種類の人間入力から学習する7自由度ロボットマニピュレータについて実験を行った。
- 参考スコア(独自算出の注目度): 34.53709602861176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human input has enabled autonomous systems to improve their capabilities and
achieve complex behaviors that are otherwise challenging to generate
automatically. Recent work focuses on how robots can use such input - like
demonstrations or corrections - to learn intended objectives. These techniques
assume that the human's desired objective already exists within the robot's
hypothesis space. In reality, this assumption is often inaccurate: there will
always be situations where the person might care about aspects of the task that
the robot does not know about. Without this knowledge, the robot cannot infer
the correct objective. Hence, when the robot's hypothesis space is
misspecified, even methods that keep track of uncertainty over the objective
fail because they reason about which hypothesis might be correct, and not
whether any of the hypotheses are correct. In this paper, we posit that the
robot should reason explicitly about how well it can explain human inputs given
its hypothesis space and use that situational confidence to inform how it
should incorporate human input. We demonstrate our method on a 7
degree-of-freedom robot manipulator in learning from two important types of
human input: demonstrations of manipulation tasks, and physical corrections
during the robot's task execution.
- Abstract(参考訳): ヒューマンインプットにより、自律システムは能力を改善し、それ以外は自動生成が難しい複雑な動作を実現することができる。
最近の研究は、ロボットが意図した目的を学習するために、デモや修正のような入力をどのように使用できるかに焦点を当てている。
これらの手法は、人間の望ましい目的がロボットの仮説空間内にすでに存在すると仮定する。
実際には、この仮定はしばしば不正確であり、ロボットが知らないタスクの側面を気にすることがある場合は常にある。
この知識がなければ、ロボットは正しい目的を推測できない。
したがって、ロボットの仮説空間が誤って特定された場合、どの仮説が正しいか、あるいはどの仮説が正しいのかを推論するため、目的に対する不確実性を追跡する方法でさえ失敗する。
本稿では,ロボットが仮説空間から人間の入力をいかにうまく説明できるかを明確に説明し,その状況の信頼度を用いて,どのように人間の入力を取り入れるべきかを説明する。
本手法は,操作課題の提示と作業実行時の身体的修正という2つの重要な入力から学習するための,自由度7自由度ロボットマニピュレータ上での手法である。
関連論文リスト
- Learning Object Properties Using Robot Proprioception via Differentiable Robot-Object Interaction [52.12746368727368]
微分可能シミュレーションは、システム識別の強力なツールとなっている。
本手法は,オブジェクト自体のデータに頼ることなく,ロボットからの情報を用いてオブジェクト特性を校正する。
低コストなロボットプラットフォームにおける本手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-10-04T20:48:38Z) - Guessing human intentions to avoid dangerous situations in caregiving robots [1.3546242205182986]
本研究では,人間の危険状況を検出するアルゴリズムを提案する。
ATMにシミュレーションベースのアプローチを導入し、「いいね!」ポリシーを採用し、人々に意図や行動を割り当てる。
このアルゴリズムは既存の認知アーキテクチャの一部として実装され、シミュレーションシナリオでテストされている。
論文 参考訳(メタデータ) (2024-03-24T20:43:29Z) - SACSoN: Scalable Autonomous Control for Social Navigation [62.59274275261392]
我々は、社会的に邪魔にならないナビゲーションのための政策の訓練方法を開発した。
この反事実的摂動を最小化することにより、共有空間における人間の自然な振る舞いを変えない方法でロボットに行動を促すことができる。
屋内移動ロボットが人間の傍観者と対話する大規模なデータセットを収集する。
論文 参考訳(メタデータ) (2023-06-02T19:07:52Z) - Aligning Robot and Human Representations [50.070982136315784]
ロボット工学における現在の表現学習アプローチは、表現アライメントの目的がいかにうまく達成されているかの観点から研究されるべきである。
問題を数学的に定義し、その鍵となるデシダータを同定し、この形式主義の中に現在の方法を置く。
論文 参考訳(メタデータ) (2023-02-03T18:59:55Z) - Learning Reward Functions for Robotic Manipulation by Observing Humans [92.30657414416527]
我々は、ロボット操作ポリシーのタスク非依存報酬関数を学習するために、幅広い操作タスクを解く人間のラベル付きビデオを使用する。
学習された報酬は、タイムコントラストの目的を用いて学習した埋め込み空間におけるゴールまでの距離に基づいている。
論文 参考訳(メタデータ) (2022-11-16T16:26:48Z) - Robots with Different Embodiments Can Express and Influence Carefulness
in Object Manipulation [104.5440430194206]
本研究では,2つのロボットによるコミュニケーション意図による物体操作の知覚について検討する。
ロボットの動きを設計し,物体の搬送時に注意を喚起するか否かを判断した。
論文 参考訳(メタデータ) (2022-08-03T13:26:52Z) - Explain yourself! Effects of Explanations in Human-Robot Interaction [10.389325878657697]
ロボット決定の説明は、ユーザーの知覚に影響を与え、信頼性を正当化し、信頼を高める。
ロボットが人間の知覚に与える影響は、まだ十分に研究されていない。
本研究は、人間とロボットの相互作用を説明する必要性と可能性を示す。
論文 参考訳(メタデータ) (2022-04-09T15:54:27Z) - AAAI SSS-22 Symposium on Closing the Assessment Loop: Communicating
Proficiency and Intent in Human-Robot Teaming [4.787322716745613]
ロボットは新しいタスクで予測能力を伝えるにはどうすればいいのか?
ロボットは人間の意図や価値観に基づいて、その習熟度基準をどう順応すべきか?
熟練度と意図に基づく相互作用を評価するための基準については合意されていない。
論文 参考訳(メタデータ) (2022-04-05T18:28:01Z) - Reasoning about Counterfactuals to Improve Human Inverse Reinforcement
Learning [5.072077366588174]
人間は自然に、観察可能な行動について推論することで、他のエージェントの信念や欲求を推測する。
我々は,ロボットの意思決定に対する学習者の現在の理解を,人間のIRLモデルに組み込むことを提案する。
また,人間が見えない環境下でのロボットの動作を予測しにくいことを推定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-03-03T17:06:37Z) - Human Grasp Classification for Reactive Human-to-Robot Handovers [50.91803283297065]
本稿では,ロボットが人間に遭遇するロボットのハンドオーバに対するアプローチを提案する。
対象物をさまざまな手形やポーズで保持する典型的な方法をカバーする,人間の把握データセットを収集する。
本稿では,検出した把握位置と手の位置に応じて人手から対象物を取り出す計画実行手法を提案する。
論文 参考訳(メタデータ) (2020-03-12T19:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。