Fugu-MT 論文翻訳(概要): SoLo T-DIRL: Socially-Aware Dynamic Local Planner based on Trajectory-Ranked Deep Inverse Reinforcement Learning

論文の概要: SoLo T-DIRL: Socially-Aware Dynamic Local Planner based on Trajectory-Ranked Deep Inverse Reinforcement Learning

arxiv url: http://arxiv.org/abs/2209.07996v1
Date: Fri, 16 Sep 2022 15:13:33 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-19 13:18:34.500885
Title: SoLo T-DIRL: Socially-Aware Dynamic Local Planner based on Trajectory-Ranked Deep Inverse Reinforcement Learning
Title（参考訳）: SoLo T-DIRL:軌道誘導深部逆強化学習に基づく動的局所プランナ
Authors: Yifan Xu, Theodor Chakhachiro, Tribhi Kathuria, and Maani Ghaffari
Abstract要約: 本研究は,最近提案されたT-MEDIRL(T-MEDIRL)に基づく,混在環境における動的局所プランナのための新しい枠組みを提案する。ソーシャルナビゲーション問題に対処するため,我々のマルチモーダル学習プランナーは,T-MEDIRLパイプラインにおける社会的相互作用の要因だけでなく,社会的相互作用の要因も考慮し,人間の実演から報酬関数を学習する。評価の結果,ロボットが混み合った社会環境をナビゲートし,その成功率やナビゲーションの点で最先端の社会ナビゲーション手法より優れていることがわかった。
参考スコア（独自算出の注目度）: 4.008601554204486
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This work proposes a new framework for a socially-aware dynamic local planner in crowded environments by building on the recently proposed Trajectory-ranked Maximum Entropy Deep Inverse Reinforcement Learning (T-MEDIRL). To address the social navigation problem, our multi-modal learning planner explicitly considers social interaction factors, as well as social-awareness factors into T-MEDIRL pipeline to learn a reward function from human demonstrations. Moreover, we propose a novel trajectory ranking score using the sudden velocity change of pedestrians around the robot to address the sub-optimality in human demonstrations. Our evaluation shows that this method can successfully make a robot navigate in a crowded social environment and outperforms the state-of-art social navigation methods in terms of the success rate, navigation time, and invasion rate.
Abstract（参考訳）: 本研究は,最近提案されたT-MEDIRL(Trjectory-ranked Maximum Entropy Deep Inverse Reinforcement Learning)に基づく,混雑した環境における動的局所プランナのための新しいフレームワークを提案する。ソーシャルナビゲーション問題に対処するため,我々のマルチモーダル学習プランナーは,T-MEDIRLパイプラインにおける社会的相互作用要因と社会的認識因子を明示的に検討し,人間の実演から報酬関数を学習する。さらに,ロボットまわりの歩行者の突然の速度変化を利用して,人間のデモの最適性に対処した新しい軌道ランキングスコアを提案する。本手法は,ロボットが混在する社会環境下での移動に成功し,成功率,航法時間,侵入率において最先端の社会ナビゲーション手法より優れていることを示す。

関連論文リスト

Hierarchical Reinforcement Learning for Safe Mapless Navigation with Congestion Estimation [7.339743259039457]
本稿では,階層的強化学習(HRL)を利用した安全な地図レスナビゲーションフレームワークを提案する。その結果,HRLに基づくナビゲーションフレームワークは静的シナリオと動的シナリオの両方で優れていることがわかった。本研究では,物理的な検証実験を行うために,TurtleBot3ロボット上にHRLベースのナビゲーションフレームワークを実装した。
論文参考訳（メタデータ） (2025-03-15T08:03:50Z)
GSON: A Group-based Social Navigation Framework with Large Multimodal Model [9.94576166903495]
移動ロボットが周囲の社会集団を知覚し利用できるようにするためのグループベースのソーシャルナビゲーションフレームワークGSONを提案する。認識のために、歩行者間の社会的関係をゼロショットで抽出する視覚的プロンプト技術を適用した。計画には,グローバルパス計画とローカルモーションプランニングの橋渡しとして,社会構造に基づく中間プランナを採用する。
論文参考訳（メタデータ） (2024-09-26T17:27:15Z)
A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements [51.54559117314768]
タスク・アンド・モーション・プランニング(タスク・アンド・モーション・プランニング、TAMP)は、自動化された計画問題の解決策を見つけるための問題である。本稿では,TAMP問題のモデル化とベンチマークを行うための,汎用的でオープンソースのフレームワークを提案する。移動エージェントと複数のタスク状態依存障害を含むTAMP問題を解決する革新的なメタ技術を導入する。
論文参考訳（メタデータ） (2024-08-11T14:57:57Z)
Research on Autonomous Robots Navigation based on Reinforcement Learning [13.559881645869632]
我々は、経路計画と意思決定プロセスを最適化するために、Deep Q Network (DQN) と Proximal Policy Optimization (PPO) モデルを使用します。様々な複雑なシナリオにおいて,これらのモデルの有効性とロバスト性を検証した。
論文参考訳（メタデータ） (2024-07-02T00:44:06Z)
Online Context Learning for Socially-compliant Navigation [49.609656402450746]
本文では,ロボットが新たな社会環境に適応できるようにするための,オンラインコンテキスト学習手法を紹介する。コミュニティワイドシミュレータを用いた実験により,本手法は最先端のシミュレータよりも優れていることが示された。
論文参考訳（メタデータ） (2024-06-17T12:59:13Z)
Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文参考訳（メタデータ） (2024-01-22T18:58:22Z)
Exploring Social Motion Latent Space and Human Awareness for Effective Robot Navigation in Crowded Environments [3.714800947440209]
提案手法は,成功率,航法時間,軌道長などのソーシャルナビゲーション指標を大幅に改善する。ロボットに対する人間の意識の概念は、社会ロボットナビゲーションフレームワークに導入されている。
論文参考訳（メタデータ） (2023-10-11T09:25:24Z)
SocNavGym: A Reinforcement Learning Gym for Social Navigation [0.0]
SocNavGymは、ソーシャルナビゲーションのための高度なシミュレーション環境である。さまざまなタイプのソーシャルナビゲーションシナリオを生成することができる。また、さまざまな手作りとデータ駆動のソーシャル報酬信号を扱うように設定することもできる。
論文参考訳（メタデータ） (2023-04-27T11:29:02Z)
Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文参考訳（メタデータ） (2023-03-30T17:58:36Z)
Socially Compliant Navigation Dataset (SCAND): A Large-Scale Dataset of Demonstrations for Social Navigation [92.66286342108934]
社会ナビゲーションは、ロボットのような自律的なエージェントが、人間のような他の知的エージェントの存在下で、社会的に従順な方法でナビゲートする能力である。私たちのデータセットには8.7時間、128の軌道、25マイルの社会的に適合した人間の遠隔運転デモが含まれています。
論文参考訳（メタデータ） (2022-03-28T19:09:11Z)
Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文参考訳（メタデータ） (2020-07-07T17:19:56Z)
Path Planning in Dynamic Environments using Generative RNNs and Monte Carlo Tree Search [11.412720572948086]
群衆や交通などの動的環境におけるロボット経路計画のための最先端の手法は、エージェントのための手作りのモーションモデルに依存している。本稿では,モンテカルロ木探索(MCTS)における生成的リカレントニューラルネットワークを用いた統合経路計画フレームワークを提案する。提案手法は,対話時の動作予測精度を大幅に向上させることができることを示す。
論文参考訳（メタデータ） (2020-01-30T22:46:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。