論文の概要: L2B: Learning to Balance the Safety-Efficiency Trade-off in Interactive
Crowd-aware Robot Navigation
- arxiv url: http://arxiv.org/abs/2003.09207v2
- Date: Wed, 7 Oct 2020 18:30:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 23:10:58.293542
- Title: L2B: Learning to Balance the Safety-Efficiency Trade-off in Interactive
Crowd-aware Robot Navigation
- Title(参考訳): l2b: 対話型クラウドアウェアロボットナビゲーションにおける安全性と効率のバランスをとるための学習
- Authors: Mai Nishimura, Ryo Yonetani
- Abstract要約: Learning to Balance(L2B)フレームワークにより、モバイルロボットエージェントは、群衆との衝突を避けることにより、目的地に向かって安全に操縦することができる。
観衆を意識したナビゲーションにおける安全性と効率の要件は,エージェントと観衆の間での社会的ジレンマの存在においてトレードオフがあることを観察する。
我々は,我々のL2Bフレームワークを挑戦的な群集シミュレーションで評価し,航法成功率と衝突速度の両方の観点から,最先端の航法アプローチよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 11.893324664457548
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents a deep reinforcement learning framework for interactive
navigation in a crowded place. Our proposed approach, Learning to Balance (L2B)
framework enables mobile robot agents to steer safely towards their
destinations by avoiding collisions with a crowd, while actively clearing a
path by asking nearby pedestrians to make room, if necessary, to keep their
travel efficient. We observe that the safety and efficiency requirements in
crowd-aware navigation have a trade-off in the presence of social dilemmas
between the agent and the crowd. On the one hand, intervening in pedestrian
paths too much to achieve instant efficiency will result in collapsing a
natural crowd flow and may eventually put everyone, including the self, at risk
of collisions. On the other hand, keeping in silence to avoid every single
collision will lead to the agent's inefficient travel. With this observation,
our L2B framework augments the reward function used in learning an interactive
navigation policy to penalize frequent active path clearing and passive
collision avoidance, which substantially improves the balance of the
safety-efficiency trade-off. We evaluate our L2B framework in a challenging
crowd simulation and demonstrate its superiority, in terms of both navigation
success and collision rate, over a state-of-the-art navigation approach.
- Abstract(参考訳): 本研究は,混み合った場所でのインタラクティブナビゲーションのための深層強化学習フレームワークを提案する。
提案手法であるLearning to Balance(L2B)により,移動ロボットエージェントは,群集との衝突を回避し,移動経路を積極的にクリアし,移動を効率よく維持する。
観衆を意識したナビゲーションにおける安全性と効率の要件は,エージェントと観衆の間の社会的ジレンマの存在においてトレードオフがある。
一方、歩行者の経路に介入してすぐに効率を上げることは、自然の群衆の流れを崩壊させ、最終的には自己を含む全員を衝突のリスクに晒すことになる。
一方、あらゆる衝突を避けるために沈黙を維持することは、エージェントの非効率な移動につながる。
この観察により、我々のL2Bフレームワークは、対話的ナビゲーションポリシーの学習に使用される報酬関数を拡張し、頻繁なアクティブパスクリアリングと受動的衝突回避をペナルティ化し、安全性と効率のトレードオフのバランスを大幅に改善する。
我々は,我々のL2Bフレームワークを挑戦的な群集シミュレーションで評価し,航法成功率と衝突速度の両方の観点から,最先端の航法アプローチよりも優れていることを示す。
関連論文リスト
- Controllable Safety-Critical Closed-loop Traffic Simulation via Guided
Diffusion [100.4988219600854]
誘導拡散モデルに根ざした新しいクローズドループシミュレーションフレームワークを提案する。
提案手法は, 現実の条件を密にエミュレートする現実的なロングテールシナリオの生成と, 制御性の向上という, 二つの異なる利点をもたらす。
我々はNuScenesデータセットを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Two-step dynamic obstacle avoidance [0.0]
本稿では,教師付き学習と強化学習を組み合わせた動的障害物回避タスクのための2段階アーキテクチャを提案する。
最初のステップでは、リカレントニューラルネットワークを用いて障害物の衝突リスクを推定するためのデータ駆動型アプローチを導入する。
第2ステップでは、これらの衝突リスク推定値をRLエージェントの観察空間に含め、その状況意識を高める。
論文 参考訳(メタデータ) (2023-11-28T14:55:50Z) - Evaluation of Safety Constraints in Autonomous Navigation with Deep
Reinforcement Learning [62.997667081978825]
学習可能なナビゲーションポリシとして,セーフとアンセーフの2つを比較します。
安全なポリシは、制約をアカウントに含めますが、もう一方はそうではありません。
安全政策は、よりクリアランスの高い軌道を生成することができ(障害物によらず)、全体的な性能を犠牲にすることなく、トレーニング中に衝突を減らすことができることを示す。
論文 参考訳(メタデータ) (2023-07-27T01:04:57Z) - Ada-NAV: Adaptive Trajectory-Based Sample Efficient Policy Learning for
Robotic Navigation [75.36145696421038]
Ada-NAVは、ロボットナビゲーションタスクにおける強化学習アルゴリズムのトレーニングサンプル効率を高めるために設計された新しい適応軌道長スキームである。
我々は、Ada-NAVが一定またはランダムにサンプリングされた軌道長を用いる従来の手法よりも優れているというシミュレーションと実世界のロボット実験を通して実証する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - Deep Reinforcement Learning-Based Mapless Crowd Navigation with
Perceived Risk of the Moving Crowd for Mobile Robots [0.0]
現在最先端のクラウドナビゲーションアプローチは、主に深層強化学習(DRL)に基づくものである。
本研究では,観測空間に衝突確率(CP)を組み込んで,移動する群衆の危険度をロボットに知覚する手法を提案する。
論文 参考訳(メタデータ) (2023-04-07T11:29:59Z) - Holistic Deep-Reinforcement-Learning-based Training of Autonomous
Navigation Systems [4.409836695738518]
Deep Reinforcement Learningは、地上車両の自律的なナビゲーションのための有望なアプローチとして登場した。
本稿では,ナビゲーションスタックの全要素を含む総合的な深層強化学習手法を提案する。
論文 参考訳(メタデータ) (2023-02-06T16:52:15Z) - Multi-task Safe Reinforcement Learning for Navigating Intersections in
Dense Traffic [10.085223486314929]
マルチタスク交差点ナビゲーションは、自動運転にとって依然として困難な課題である。
人間ドライバーにとって、他の対話型車両との交渉スキルは、安全性と効率性を保証する鍵となる。
我々は、他の交通機関の参加者と対話する際の安全性と効率を改善するために、社会的な注意を伴うマルチタスク安全な強化学習を定式化する。
論文 参考訳(メタデータ) (2022-02-19T17:09:46Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Vision-Based Mobile Robotics Obstacle Avoidance With Deep Reinforcement
Learning [49.04274612323564]
障害物回避は、移動ロボットの自律ナビゲーションのための根本的かつ困難な問題です。
本稿では,ロボットが単一眼カメラにのみ依存しなければならない単純な3D環境における障害物回避の問題を検討する。
データ駆動型エンドツーエンドディープラーニングアプローチとして,障害回避問題に取り組む。
論文 参考訳(メタデータ) (2021-03-08T13:05:46Z) - Language-guided Navigation via Cross-Modal Grounding and Alternate
Adversarial Learning [66.9937776799536]
新たなビジョン・アンド・ランゲージナビゲーション(VLN)問題は、見えない写真リアリスティック環境において、エージェントがターゲットの場所に向かうことを学習することを目的としている。
VLNの主な課題は、主に2つの側面から生じている: まず、エージェントは動的に変化する視覚環境に対応する言語命令の有意義な段落に出席する必要がある。
そこで本稿では,エージェントにテキストと視覚の対応性を追跡する機能を持たせるために,クロスモーダルグラウンドモジュールを提案する。
論文 参考訳(メタデータ) (2020-11-22T09:13:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。