論文の概要: RILI: Robustly Influencing Latent Intent
- arxiv url: http://arxiv.org/abs/2203.12705v1
- Date: Wed, 23 Mar 2022 19:55:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-26 02:25:25.404935
- Title: RILI: Robustly Influencing Latent Intent
- Title(参考訳): RILI: 遅延インテントのロバストな影響
- Authors: Sagar Parekh, Soheil Habibian, and Dylan P. Losey
- Abstract要約: 変化するパートナーのダイナミクスに影響を与えることを学ぶ頑健なアプローチを提案する。
提案手法は, 対話の繰り返しを通じて, パートナーの集合を訓練する。
そして、ロボットが元のパートナーと学んだ軌跡をサンプリングすることで、新しいパートナーに迅速に適応する。
- 参考スコア(独自算出の注目度): 7.025418443146435
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When robots interact with human partners, often these partners change their
behavior in response to the robot. On the one hand this is challenging because
the robot must learn to coordinate with a dynamic partner. But on the other
hand -- if the robot understands these dynamics -- it can harness its own
behavior, influence the human, and guide the team towards effective
collaboration. Prior research enables robots to learn to influence other robots
or simulated agents. In this paper we extend these learning approaches to now
influence humans. What makes humans especially hard to influence is that -- not
only do humans react to the robot -- but the way a single user reacts to the
robot may change over time, and different humans will respond to the same robot
behavior in different ways. We therefore propose a robust approach that learns
to influence changing partner dynamics. Our method first trains with a set of
partners across repeated interactions, and learns to predict the current
partner's behavior based on the previous states, actions, and rewards. Next, we
rapidly adapt to new partners by sampling trajectories the robot learned with
the original partners, and then leveraging those existing behaviors to
influence the new partner dynamics. We compare our resulting algorithm to
state-of-the-art baselines across simulated environments and a user study where
the robot and participants collaborate to build towers. We find that our
approach outperforms the alternatives, even when the partner follows new or
unexpected dynamics. Videos of the user study are available here:
https://youtu.be/lYsWM8An18g
- Abstract(参考訳): ロボットが人間のパートナーと対話するとき、これらのパートナーはロボットに反応して行動を変えることが多い。
一方、ロボットはダイナミックなパートナーと協調することを学ぶ必要があるため、これは難しい。
しかし一方で、もしロボットがこれらのダイナミクスを理解しているなら、ロボットは自身の振る舞いを活用し、人間に影響を与え、効果的なコラボレーションへとチームを導くことができる。
先行研究により、ロボットは他のロボットやシミュレーションエージェントに影響を与えることができる。
本稿では,これらの学習方法を拡張し,人間に影響を与えている。
人間に特に影響を与えるのは、人間がロボットに反応するだけでなく、一人のユーザーがロボットに反応する方法が時間とともに変化し、異なる人間が同じロボットの振る舞いに異なる方法で反応する、ということです。
そこで我々は,パートナーのダイナミクスの変化に影響を及ぼすロバストなアプローチを提案する。
提案手法は,まず,反復的なインタラクションを通じてパートナーのセットを訓練し,過去の状態,行動,報酬に基づいて現在のパートナーの行動を予測する。
次に、ロボットが元のパートナーから学んだ軌跡をサンプリングし、既存の行動を利用して新しいパートナーのダイナミクスに影響を与えることで、新しいパートナーに迅速に適応する。
その結果得られたアルゴリズムをシミュレーション環境における最先端のベースラインと比較し,ロボットと参加者が協調してタワーを構築するユーザ調査を行った。
パートナーが新しい、あるいは予期せぬダイナミクスに従っていても、私たちのアプローチは代替手段よりも優れています。
ユーザー調査のビデオはこちら。 https://youtu.be/lyswm8an18g
関連論文リスト
- SACSoN: Scalable Autonomous Control for Social Navigation [62.59274275261392]
我々は、社会的に邪魔にならないナビゲーションのための政策の訓練方法を開発した。
この反事実的摂動を最小化することにより、共有空間における人間の自然な振る舞いを変えない方法でロボットに行動を促すことができる。
屋内移動ロボットが人間の傍観者と対話する大規模なデータセットを収集する。
論文 参考訳(メタデータ) (2023-06-02T19:07:52Z) - Learning Latent Representations to Co-Adapt to Humans [12.71953776723672]
非定常的な人間はロボット学習者に挑戦しています。
本稿では,ロボットが動的人間と協調して適応できるアルゴリズム形式について紹介する。
論文 参考訳(メタデータ) (2022-12-19T16:19:24Z) - Synthesis and Execution of Communicative Robotic Movements with
Generative Adversarial Networks [59.098560311521034]
我々は、繊細な物体を操作する際に人間が採用するのと同じキネマティクス変調を2つの異なるロボットプラットフォームに転送する方法に焦点を当てる。
我々は、ロボットのエンドエフェクターが採用する速度プロファイルを、異なる特徴を持つ物体を輸送する際に人間が何をするかに触発されて調整する。
我々は、人体キネマティクスの例を用いて訓練され、それらを一般化し、新しい有意義な速度プロファイルを生成する、新しいジェネレーティブ・アドバイサル・ネットワークアーキテクチャを利用する。
論文 参考訳(メタデータ) (2022-03-29T15:03:05Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - Physical Interaction as Communication: Learning Robot Objectives Online
from Human Corrections [33.807697939765205]
物理的人間とロボットの相互作用(pHRI)は、しばしば故意に行われます。
そこで本論文では,pHRIが意図的であれば,ロボットはインタラクションを活用して,人間に許された後でも,現在のタスクの残りを完了させる方法を学ぶことができる,という情報も有益である,と論じる。
以上の結果から,pHRIからの学習がタスクパフォーマンスの向上と満足度の向上につながることが示唆された。
論文 参考訳(メタデータ) (2021-07-06T02:25:39Z) - A proxemics game between festival visitors and an industrial robot [1.2599533416395767]
人間ロボットチームのコラボレーションパートナーの非言語的行動は、ヒューマンインタラクションパートナーの体験に影響を及ぼす。
Ars Electronica 2020 Festival for Art, Technology and Society(オーストリア、リンツ)では,産業用ロボットとの対話を招待した。
本研究では,ロボットと対話する人間の一般的な非言語行動と,聴衆の非言語行動について検討した。
論文 参考訳(メタデータ) (2021-05-28T13:26:00Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z) - Affect-Driven Modelling of Robot Personality for Collaborative
Human-Robot Interactions [16.40684407420441]
協調的な相互作用は、人間の感情的行動のダイナミクスに適応するために社会ロボットを必要とする。
社会ロボットにおける人格駆動行動生成のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-10-14T16:34:14Z) - Joint Mind Modeling for Explanation Generation in Complex Human-Robot
Collaborative Tasks [83.37025218216888]
本稿では,人間とロボットのコラボレーションにおいて,人間のようなコミュニケーションを実現するための新しい説明可能なAI(XAI)フレームワークを提案する。
ロボットは、人間のユーザの階層的なマインドモデルを構築し、コミュニケーションの一形態として自身のマインドの説明を生成する。
その結果,提案手法はロボットの協調動作性能とユーザ認識を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2020-07-24T23:35:03Z) - Social Navigation with Human Empowerment driven Deep Reinforcement
Learning [20.815007485176615]
次世代のモバイルロボットは、人間の協力者によって受け入れられるために、社会的に準拠する必要がある。
本稿では,古典的acfRLのアプローチを超えて,エンパワーメントを用いた本質的なモチベーションをエージェントに提供する。
我々のアプローチは、人間との距離を最小化し、それによって、効率的に目標に向かって移動しながら、人間の移動時間を短縮するので、人間に肯定的な影響を与える。
論文 参考訳(メタデータ) (2020-03-18T11:16:07Z) - Human Grasp Classification for Reactive Human-to-Robot Handovers [50.91803283297065]
本稿では,ロボットが人間に遭遇するロボットのハンドオーバに対するアプローチを提案する。
対象物をさまざまな手形やポーズで保持する典型的な方法をカバーする,人間の把握データセットを収集する。
本稿では,検出した把握位置と手の位置に応じて人手から対象物を取り出す計画実行手法を提案する。
論文 参考訳(メタデータ) (2020-03-12T19:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。