論文の概要: SoLo T-DIRL: Socially-Aware Dynamic Local Planner based on
Trajectory-Ranked Deep Inverse Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2209.07996v1
- Date: Fri, 16 Sep 2022 15:13:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-19 13:18:34.500885
- Title: SoLo T-DIRL: Socially-Aware Dynamic Local Planner based on
Trajectory-Ranked Deep Inverse Reinforcement Learning
- Title(参考訳): SoLo T-DIRL:軌道誘導深部逆強化学習に基づく動的局所プランナ
- Authors: Yifan Xu, Theodor Chakhachiro, Tribhi Kathuria, and Maani Ghaffari
- Abstract要約: 本研究は,最近提案されたT-MEDIRL(T-MEDIRL)に基づく,混在環境における動的局所プランナのための新しい枠組みを提案する。
ソーシャルナビゲーション問題に対処するため,我々のマルチモーダル学習プランナーは,T-MEDIRLパイプラインにおける社会的相互作用の要因だけでなく,社会的相互作用の要因も考慮し,人間の実演から報酬関数を学習する。
評価の結果,ロボットが混み合った社会環境をナビゲートし,その成功率やナビゲーションの点で最先端の社会ナビゲーション手法より優れていることがわかった。
- 参考スコア(独自算出の注目度): 4.008601554204486
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work proposes a new framework for a socially-aware dynamic local planner
in crowded environments by building on the recently proposed Trajectory-ranked
Maximum Entropy Deep Inverse Reinforcement Learning (T-MEDIRL). To address the
social navigation problem, our multi-modal learning planner explicitly
considers social interaction factors, as well as social-awareness factors into
T-MEDIRL pipeline to learn a reward function from human demonstrations.
Moreover, we propose a novel trajectory ranking score using the sudden velocity
change of pedestrians around the robot to address the sub-optimality in human
demonstrations. Our evaluation shows that this method can successfully make a
robot navigate in a crowded social environment and outperforms the state-of-art
social navigation methods in terms of the success rate, navigation time, and
invasion rate.
- Abstract(参考訳): 本研究は,最近提案されたT-MEDIRL(Trjectory-ranked Maximum Entropy Deep Inverse Reinforcement Learning)に基づく,混雑した環境における動的局所プランナのための新しいフレームワークを提案する。
ソーシャルナビゲーション問題に対処するため,我々のマルチモーダル学習プランナーは,T-MEDIRLパイプラインにおける社会的相互作用要因と社会的認識因子を明示的に検討し,人間の実演から報酬関数を学習する。
さらに,ロボットまわりの歩行者の突然の速度変化を利用して,人間のデモの最適性に対処した新しい軌道ランキングスコアを提案する。
本手法は,ロボットが混在する社会環境下での移動に成功し,成功率,航法時間,侵入率において最先端の社会ナビゲーション手法より優れていることを示す。
関連論文リスト
- Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [55.65482030032804]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
提案手法は,軌道予測器が将来の状態を生成するために使用する関係の進化を捉えるために,動的に進化する関係グラフとハイパーグラフを推論する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Exploring Social Motion Latent Space and Human Awareness for Effective
Robot Navigation in Crowded Environments [3.714800947440209]
提案手法は,成功率,航法時間,軌道長などのソーシャルナビゲーション指標を大幅に改善する。
ロボットに対する人間の意識の概念は、社会ロボットナビゲーションフレームワークに導入されている。
論文 参考訳(メタデータ) (2023-10-11T09:25:24Z) - Ada-NAV: Adaptive Trajectory-Based Sample Efficient Policy Learning for
Robotic Navigation [75.36145696421038]
Ada-NAVは、ロボットナビゲーションタスクにおける強化学習アルゴリズムのトレーニングサンプル効率を高めるために設計された新しい適応軌道長スキームである。
我々は、Ada-NAVが一定またはランダムにサンプリングされた軌道長を用いる従来の手法よりも優れているというシミュレーションと実世界のロボット実験を通して実証する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - SocNavGym: A Reinforcement Learning Gym for Social Navigation [0.0]
SocNavGymは、ソーシャルナビゲーションのための高度なシミュレーション環境である。
さまざまなタイプのソーシャルナビゲーションシナリオを生成することができる。
また、さまざまな手作りとデータ駆動のソーシャル報酬信号を扱うように設定することもできる。
論文 参考訳(メタデータ) (2023-04-27T11:29:02Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - Exploiting Socially-Aware Tasks for Embodied Social Navigation [17.48110264302196]
本稿では,ソーシャル・アウェア・タスクを活用して,強化学習ナビゲーションポリシーに注入するエンド・ツー・エンドアーキテクチャを提案する。
この目的のために、我々のタスクは衝突の即時および将来の危険という概念を利用する。
Gibson4+およびHabitat-Matterport3Dデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2022-12-01T18:52:46Z) - Multi-robot Social-aware Cooperative Planning in Pedestrian Environments
Using Multi-agent Reinforcement Learning [2.7716102039510564]
我々は、非政治的マルチエージェント強化学習(MARL)に基づく、新しいマルチロボット・ソーシャル・アウェア・効率的な協調プランナーを提案する。
我々は、時間空間グラフ(TSG)に基づくソーシャルエンコーダを採用し、その視野における各ロボットと歩行者の社会的関係の重要性をよりよく抽出する。
論文 参考訳(メタデータ) (2022-11-29T03:38:47Z) - Socially Compliant Navigation Dataset (SCAND): A Large-Scale Dataset of
Demonstrations for Social Navigation [92.66286342108934]
社会ナビゲーションは、ロボットのような自律的なエージェントが、人間のような他の知的エージェントの存在下で、社会的に従順な方法でナビゲートする能力である。
私たちのデータセットには8.7時間、128の軌道、25マイルの社会的に適合した人間の遠隔運転デモが含まれています。
論文 参考訳(メタデータ) (2022-03-28T19:09:11Z) - PHASE: PHysically-grounded Abstract Social Events for Machine Social
Perception [50.551003004553806]
私たちは、物理的に根拠のある抽象的なソーシャルイベント、フェーズのデータセットを作成します。
フェーズは人間の実験によって検証され、人間は社会出来事において豊かな相互作用を知覚する。
ベースラインモデルとして,最新のフィードフォワードニューラルネットワークよりも優れたベイズ逆計画手法SIMPLEを導入する。
論文 参考訳(メタデータ) (2021-03-02T18:44:57Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z) - Path Planning in Dynamic Environments using Generative RNNs and Monte
Carlo Tree Search [11.412720572948086]
群衆や交通などの動的環境におけるロボット経路計画のための最先端の手法は、エージェントのための手作りのモーションモデルに依存している。
本稿では,モンテカルロ木探索(MCTS)における生成的リカレントニューラルネットワークを用いた統合経路計画フレームワークを提案する。
提案手法は,対話時の動作予測精度を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2020-01-30T22:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。