論文の概要: Robot Navigation in Constrained Pedestrian Environments using
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2010.08600v2
- Date: Mon, 16 Nov 2020 06:26:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 21:39:39.451543
- Title: Robot Navigation in Constrained Pedestrian Environments using
Reinforcement Learning
- Title(参考訳): 強化学習を用いた制約歩行者環境におけるロボットナビゲーション
- Authors: Claudia P\'erez-D'Arpino, Can Liu, Patrick Goebel, Roberto
Mart\'in-Mart\'in, Silvio Savarese
- Abstract要約: 歩行者のまわりをスムーズに移動することは、人間環境に展開する移動ロボットに必要な能力である。
移動歩行者の存在に動的に適応できる政策を学習するための強化学習に基づくアプローチを提案する。
2つの実環境の3D再構成に学習方針の移転を示す。
- 参考スコア(独自算出の注目度): 32.454250811667904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Navigating fluently around pedestrians is a necessary capability for mobile
robots deployed in human environments, such as buildings and homes. While
research on social navigation has focused mainly on the scalability with the
number of pedestrians in open spaces, typical indoor environments present the
additional challenge of constrained spaces such as corridors and doorways that
limit maneuverability and influence patterns of pedestrian interaction. We
present an approach based on reinforcement learning (RL) to learn policies
capable of dynamic adaptation to the presence of moving pedestrians while
navigating between desired locations in constrained environments. The policy
network receives guidance from a motion planner that provides waypoints to
follow a globally planned trajectory, whereas RL handles the local
interactions. We explore a compositional principle for multi-layout training
and find that policies trained in a small set of geometrically simple layouts
successfully generalize to more complex unseen layouts that exhibit composition
of the structural elements available during training. Going beyond walls-world
like domains, we show transfer of the learned policy to unseen 3D
reconstructions of two real environments. These results support the
applicability of the compositional principle to navigation in real-world
buildings and indicate promising usage of multi-agent simulation within
reconstructed environments for tasks that involve interaction.
- Abstract(参考訳): 歩行者のまわりをスムーズに移動することは、建物や家などの人間環境に展開する移動ロボットに必要な能力である。
ソーシャルナビゲーションの研究は、オープンスペースでの歩行者数のスケーラビリティに重点を置いてきたが、典型的な屋内環境は、操作性や歩行者の相互作用の影響パターンを制限する廊下や戸口などの制約された空間のさらなる課題を呈している。
本稿では,制約環境における所望の場所間をナビゲートしながら,移動歩行者の存在に動的に適応できる政策を学習するための強化学習(rl)に基づくアプローチを提案する。
ポリシーネットワークは、グローバルに計画された軌道に従うためのウェイポイントを提供するモーションプランナーからガイダンスを受け取り、RLは局所的な相互作用を処理する。
我々はマルチレイアウトトレーニングのための構成原理を探求し、幾何的に単純なレイアウトの小さなセットで訓練されたポリシーが、トレーニング中に利用可能な構造要素の構成を示すより複雑で見えないレイアウトに一般化できることを見出した。
ドメインのような壁の世界を超えて、我々は学習したポリシーを2つの実環境の未認識の3d再構成に移す。
これらの結果は,実世界の建築物のナビゲーションにおける構成原理の適用可能性をサポートし,対話を伴うタスクの再構築環境におけるマルチエージェントシミュレーションの有望な利用を示唆する。
関連論文リスト
- IN-Sight: Interactive Navigation through Sight [20.184155117341497]
IN-Sightは自己監督型パスプランニングの新しいアプローチである。
可逆性のスコアを計算し、セマンティックマップに組み込む。
障害物を正確に回避するために、IN-Sightはローカルプランナーを使用している。
論文 参考訳(メタデータ) (2024-08-01T07:27:54Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - RSPT: Reconstruct Surroundings and Predict Trajectories for
Generalizable Active Object Tracking [17.659697426459083]
本稿では, 周辺を再構成し, 対象軌道の予測を行うことにより, 構造認識の動作表現を形成するフレームワークであるRSPTを提案する。
我々は,RSPTを様々なシミュレーションシナリオで評価し,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-04-07T12:52:24Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z) - Simultaneous Navigation and Construction Benchmarking Environments [73.0706832393065]
モバイル構築のためのインテリジェントなロボット、環境をナビゲートし、幾何学的設計に従ってその構造を変更するプロセスが必要です。
このタスクでは、ロボットのビジョンと学習の大きな課題は、GPSなしでデザインを正確に達成する方法です。
我々は,手工芸政策の性能を,基礎的なローカライゼーションと計画,最先端の深層強化学習手法を用いて評価した。
論文 参考訳(メタデータ) (2021-03-31T00:05:54Z) - Learning Synthetic to Real Transfer for Localization and Navigational
Tasks [7.019683407682642]
ナビゲーションは、コンピュータビジョン、ロボット工学、制御の概念を組み合わせて、複数の分野のクロスロードにある。
この研究は、実世界への移動をできる限り少ない努力で行うことができるナビゲーションパイプラインをシミュレーションで作成することを目的としていた。
ナビゲーションパイプラインを設計するには、環境、ローカライゼーション、ナビゲーション、計画の4つの大きな課題が発生する。
論文 参考訳(メタデータ) (2020-11-20T08:37:03Z) - Embodied Visual Navigation with Automatic Curriculum Learning in Real
Environments [20.017277077448924]
NavACLは、ナビゲーションタスクに適した自動カリキュラム学習の方法である。
NavACLを用いて訓練した深層強化学習剤は、均一サンプリングで訓練した最先端エージェントよりも有意に優れていた。
我々のエージェントは、未知の乱雑な屋内環境から、RGB画像のみを使用して意味的に特定されたターゲットへ移動することができる。
論文 参考訳(メタデータ) (2020-09-11T13:28:26Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。