論文の概要: Mobile Robot Path Planning in Dynamic Environments through Globally
Guided Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2005.05420v2
- Date: Fri, 11 Sep 2020 21:14:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-04 19:54:49.853660
- Title: Mobile Robot Path Planning in Dynamic Environments through Globally
Guided Reinforcement Learning
- Title(参考訳): グローバルな強化学習による動的環境における移動ロボット経路計画
- Authors: Binyu Wang and Zhe Liu and Qingbiao Li and Amanda Prorok
- Abstract要約: 本稿では,多ボット計画問題の解決を目的として,グローバルガイド型学習強化手法(G2RL)を提案する。
G2RLは任意の環境に一般化する新しい経路報酬構造を組み込んでいる。
提案手法は,異なるマップタイプ,障害物密度,ロボット数にまたがって評価する。
- 参考スコア(独自算出の注目度): 12.813442161633116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Path planning for mobile robots in large dynamic environments is a
challenging problem, as the robots are required to efficiently reach their
given goals while simultaneously avoiding potential conflicts with other robots
or dynamic objects. In the presence of dynamic obstacles, traditional solutions
usually employ re-planning strategies, which re-call a planning algorithm to
search for an alternative path whenever the robot encounters a conflict.
However, such re-planning strategies often cause unnecessary detours. To
address this issue, we propose a learning-based technique that exploits
environmental spatio-temporal information. Different from existing
learning-based methods, we introduce a globally guided reinforcement learning
approach (G2RL), which incorporates a novel reward structure that generalizes
to arbitrary environments. We apply G2RL to solve the multi-robot path planning
problem in a fully distributed reactive manner. We evaluate our method across
different map types, obstacle densities, and the number of robots. Experimental
results show that G2RL generalizes well, outperforming existing distributed
methods, and performing very similarly to fully centralized state-of-the-art
benchmarks.
- Abstract(参考訳): ロボットは他のロボットや動的物体との潜在的な衝突を避けると同時に、与えられた目標を効率的に達成する必要があるため、大きな動的環境での移動ロボットの経路計画は難しい問題である。
ダイナミックな障害が存在する場合、従来のソリューションは通常、ロボットが衝突に遭遇するたびに代替経路を探すための計画アルゴリズムを再呼び出しする再計画戦略を採用する。
しかし、このような再計画戦略はしばしば不要な遠回りを引き起こす。
本研究では,環境時空間情報を利用した学習手法を提案する。
既存の学習ベース手法と異なり,任意の環境に一般化した新たな報酬構造を組み込んだグローバル誘導強化学習手法(g2rl)を導入する。
本稿では,G2RLを用いて,マルチボット経路計画問題の解法を提案する。
本手法は,様々なマップタイプ,障害物密度,ロボット数について評価する。
実験の結果、G2RLは、既存の分散手法より優れ、完全に集中した最先端ベンチマークと非常によく似た性能を示すことが示された。
関連論文リスト
- A Retrospective on the Robot Air Hockey Challenge: Benchmarking Robust, Reliable, and Safe Learning Techniques for Real-world Robotics [53.33976793493801]
私たちは、NeurIPS 2023カンファレンスでRobot Air Hockey Challengeを組織しました。
我々は、シム・トゥ・リアルギャップ、低レベルの制御問題、安全性問題、リアルタイム要件、実世界のデータの限られた可用性など、ロボット工学における実践的な課題に焦点を当てる。
その結果、学習に基づくアプローチと事前知識を組み合わせたソリューションは、実際のデプロイメントが困難である場合にデータのみに依存するソリューションよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-11-08T17:20:47Z) - Generalizability of Graph Neural Networks for Decentralized Unlabeled Motion Planning [72.86540018081531]
ラベルなしの動作計画では、衝突回避を確保しながら、ロボットのセットを目標の場所に割り当てる。
この問題は、探査、監視、輸送などの応用において、マルチロボットシステムにとって不可欠なビルディングブロックを形成している。
この問題に対処するために、各ロボットは、その400ドルのアネレストロボットと$k$アネレストターゲットの位置のみを知っている分散環境で対処する。
論文 参考訳(メタデータ) (2024-09-29T23:57:25Z) - Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning [11.134855513221359]
本稿では,多ボット情報経路計画のための新しい深層強化学習手法を提案する。
我々は、集中的な訓練と分散実行パラダイムを通じて強化学習政策を訓練する。
提案手法は,他の最先端のマルチロボット目標マッピング手法よりも33.75%向上する。
論文 参考訳(メタデータ) (2024-09-25T14:27:37Z) - Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文 参考訳(メタデータ) (2024-07-02T21:00:30Z) - Diffusion-Reinforcement Learning Hierarchical Motion Planning in Adversarial Multi-agent Games [6.532258098619471]
部分的に観察可能なマルチエージェント追従ゲーム(PEG)における回避目標の動作計画タスクに焦点をあてる。
これらの追尾回避問題は、捜索・救助活動や監視ロボットなど、様々な応用に関係している。
環境データに応答するグローバルパスを計画するために,高レベル拡散モデルを統合する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-03-16T03:53:55Z) - Multi-Robot Path Planning Combining Heuristics and Multi-Agent
Reinforcement Learning [0.0]
移動過程においては、移動距離を最小化しながら他の移動ロボットとの衝突を避ける必要がある。
従来の方法では、競合を避けるために探索手法を用いて経路を継続的に再設計するか、学習アプローチに基づいた衝突回避戦略を選択するかのどちらかである。
本稿では,探索,経験則,マルチエージェント強化学習を組み合わせた経路計画手法MAPPOHRを提案する。
論文 参考訳(メタデータ) (2023-06-02T05:07:37Z) - Scalable Multi-robot Motion Planning for Congested Environments With
Topological Guidance [2.846144602096543]
マルチロボットモーションプランニング(MRMP)は、連続状態空間におけるロボットの衝突のない経路を見つける問題である。
我々は、トポロジカルガイダンスによって提供される改善された効率を活用するために、既存のシングルロボットモーションプランニング手法を拡張した。
提案手法は,多くの狭い経路を持つ複雑な環境における経路を効率的に計画する能力を示し,既存の方法の最大25倍の大きさのロボットチームに拡張する。
論文 参考訳(メタデータ) (2022-10-13T16:26:01Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Simultaneous Navigation and Construction Benchmarking Environments [73.0706832393065]
モバイル構築のためのインテリジェントなロボット、環境をナビゲートし、幾何学的設計に従ってその構造を変更するプロセスが必要です。
このタスクでは、ロボットのビジョンと学習の大きな課題は、GPSなしでデザインを正確に達成する方法です。
我々は,手工芸政策の性能を,基礎的なローカライゼーションと計画,最先端の深層強化学習手法を用いて評価した。
論文 参考訳(メタデータ) (2021-03-31T00:05:54Z) - Learning to Generalize Across Long-Horizon Tasks from Human
Demonstrations [52.696205074092006]
Generalization Through Imitation (GTI) は、2段階のオフライン模倣学習アルゴリズムである。
GTIは、状態空間の共通領域で異なるタスクの軌道を示す構造を利用する。
GTIの第1段階では,異なる実演軌跡から行動を構成する能力を持つために交差点を利用する政策を訓練する。
GTIの第2段階では、ゴール指向エージェントをトレーニングして、新しいスタートとゴールの設定を一般化する。
論文 参考訳(メタデータ) (2020-03-13T02:25:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。