論文の概要: Social Navigation with Human Empowerment driven Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2003.08158v3
- Date: Wed, 5 Aug 2020 11:49:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 09:39:34.076373
- Title: Social Navigation with Human Empowerment driven Deep Reinforcement
Learning
- Title(参考訳): 人力による深層強化学習によるソーシャルナビゲーション
- Authors: Tessa van der Heiden, Florian Mirus, Herke van Hoof
- Abstract要約: 次世代のモバイルロボットは、人間の協力者によって受け入れられるために、社会的に準拠する必要がある。
本稿では,古典的acfRLのアプローチを超えて,エンパワーメントを用いた本質的なモチベーションをエージェントに提供する。
我々のアプローチは、人間との距離を最小化し、それによって、効率的に目標に向かって移動しながら、人間の移動時間を短縮するので、人間に肯定的な影響を与える。
- 参考スコア(独自算出の注目度): 20.815007485176615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile robot navigation has seen extensive research in the last decades. The
aspect of collaboration with robots and humans sharing workspaces will become
increasingly important in the future. Therefore, the next generation of mobile
robots needs to be socially-compliant to be accepted by their human
collaborators. However, a formal definition of compliance is not
straightforward. On the other hand, empowerment has been used by artificial
agents to learn complicated and generalized actions and also has been shown to
be a good model for biological behaviors. In this paper, we go beyond the
approach of classical \acf{RL} and provide our agent with intrinsic motivation
using empowerment. In contrast to self-empowerment, a robot employing our
approach strives for the empowerment of people in its environment, so they are
not disturbed by the robot's presence and motion. In our experiments, we show
that our approach has a positive influence on humans, as it minimizes its
distance to humans and thus decreases human travel time while moving
efficiently towards its own goal. An interactive user-study shows that our
method is considered more social than other state-of-the-art approaches by the
participants.
- Abstract(参考訳): モバイルロボットナビゲーションは、ここ数十年で大規模な研究が続けられている。
ロボットと人間がワークスペースを共有することによるコラボレーションの側面は、今後ますます重要になるだろう。
そのため、次世代の移動ロボットは、人間の協力者によって受け入れられるために社会的に適合する必要がある。
しかし、コンプライアンスの正式な定義は単純ではない。
一方、エンパワーメントは、複雑で一般化した行動を学ぶために人工エージェントによって用いられており、生物学的行動に良いモデルであることが示されている。
本稿では,古典的\acf{rl} のアプローチを超えて,エンパワーメントを用いてエージェントに本質的な動機付けを与える。
自己エンパワーメントとは対照的に,我々のアプローチを採用しているロボットは,環境における人々のエンパワーメントを追求しているため,ロボットの存在や動きに邪魔されることはない。
実験では,人間との距離を最小化し,目的に向かって効率的に移動しながら人間の移動時間を短縮する手法が人間に有意な影響を与えることを示した。
対話型ユーザスタディは,提案手法が,他の最先端アプローチよりもソーシャルであることを示す。
関連論文リスト
- HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation [50.616995671367704]
そこで本研究では,人型ロボットが器用な手を備えた,高次元シミュレーション型ロボット学習ベンチマークHumanoidBenchを提案する。
その結果,現在最先端の強化学習アルゴリズムがほとんどのタスクに支障をきたすのに対して,階層的学習アプローチはロバストな低レベルポリシーに支えられた場合,優れた性能を達成できることがわかった。
論文 参考訳(メタデータ) (2024-03-15T17:45:44Z) - Socially Integrated Navigation: A Social Acting Robot with Deep Reinforcement Learning [0.7864304771129751]
移動ロボットは様々な混み合った状況で大規模に使われており、私たちの社会の一部になっている。
個人を考慮した移動ロボットの社会的に許容されるナビゲーション行動は、スケーラブルなアプリケーションと人間の受容にとって必須の要件である。
本稿では,ロボットの社会行動が適応的であり,人間との相互作用から生じる,社会統合型ナビゲーション手法を提案する。
論文 参考訳(メタデータ) (2024-03-14T18:25:40Z) - Robot Interaction Behavior Generation based on Social Motion Forecasting for Human-Robot Interaction [9.806227900768926]
本稿では,共有ロボット表現空間における社会的動き予測のモデル化を提案する。
ECHOは上記の共有空間で活動し、社会的シナリオで遭遇したエージェントの将来の動きを予測する。
我々は,多対人動作予測タスクにおけるモデルの評価を行い,最先端の性能を大きなマージンで獲得する。
論文 参考訳(メタデータ) (2024-02-07T11:37:14Z) - ImitationNet: Unsupervised Human-to-Robot Motion Retargeting via Shared Latent Space [9.806227900768926]
本稿では,ロボットの動きに対する新しいディープラーニング手法を提案する。
本手法では,新しいロボットへの翻訳を容易にする,人間とロボットのペアデータを必要としない。
我々のモデルは、効率と精度の観点から、人間とロボットの類似性に関する既存の研究よりも優れています。
論文 参考訳(メタデータ) (2023-09-11T08:55:04Z) - SACSoN: Scalable Autonomous Control for Social Navigation [62.59274275261392]
我々は、社会的に邪魔にならないナビゲーションのための政策の訓練方法を開発した。
この反事実的摂動を最小化することにより、共有空間における人間の自然な振る舞いを変えない方法でロボットに行動を促すことができる。
屋内移動ロボットが人間の傍観者と対話する大規模なデータセットを収集する。
論文 参考訳(メタデータ) (2023-06-02T19:07:52Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z) - From Learning to Relearning: A Framework for Diminishing Bias in Social
Robot Navigation [3.3511723893430476]
社会的ナビゲーションモデルは、差別や差別のような社会的不公平を複製し、促進し、増幅することができる。
提案するフレームワークは,安全性と快適性を考慮したソーシャルコンテキストを学習プロセスに組み込んだtextitlearningと,発生前に潜在的に有害な結果を検出し修正するtextitrelearningの2つのコンポーネントで構成されている。
論文 参考訳(メタデータ) (2021-01-07T17:42:35Z) - Joint Mind Modeling for Explanation Generation in Complex Human-Robot
Collaborative Tasks [83.37025218216888]
本稿では,人間とロボットのコラボレーションにおいて,人間のようなコミュニケーションを実現するための新しい説明可能なAI(XAI)フレームワークを提案する。
ロボットは、人間のユーザの階層的なマインドモデルを構築し、コミュニケーションの一形態として自身のマインドの説明を生成する。
その結果,提案手法はロボットの協調動作性能とユーザ認識を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2020-07-24T23:35:03Z) - Human Grasp Classification for Reactive Human-to-Robot Handovers [50.91803283297065]
本稿では,ロボットが人間に遭遇するロボットのハンドオーバに対するアプローチを提案する。
対象物をさまざまな手形やポーズで保持する典型的な方法をカバーする,人間の把握データセットを収集する。
本稿では,検出した把握位置と手の位置に応じて人手から対象物を取り出す計画実行手法を提案する。
論文 参考訳(メタデータ) (2020-03-12T19:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。