Fugu-MT 論文翻訳(概要): Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning

論文の概要: Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning

arxiv url: http://arxiv.org/abs/2409.16967v1
Date: Wed, 25 Sep 2024 14:27:37 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-27 03:25:18.518034
Title: Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning
Title（参考訳）: 深部強化学習を用いた効率的な目標マッピングのためのマルチロボットインフォーマティブパス計画
Authors: Apoorva Vashisth, Dipam Patel, Damon Conover, Aniket Bera,
Abstract要約: 本稿では,多ボット情報経路計画のための新しい深層強化学習手法を提案する。我々は、集中的な訓練と分散実行パラダイムを通じて強化学習政策を訓練する。提案手法は,他の最先端のマルチロボット目標マッピング手法よりも33.75%向上する。
参考スコア（独自算出の注目度）: 11.134855513221359
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Autonomous robots are being employed in several mapping and data collection tasks due to their efficiency and low labor costs. In these tasks, the robots are required to map targets-of-interest in an unknown environment while constrained to a given resource budget such as path length or mission time. This is a challenging problem as each robot has to not only detect and avoid collisions from static obstacles in the environment but also has to model other robots' trajectories to avoid inter-robot collisions. We propose a novel deep reinforcement learning approach for multi-robot informative path planning to map targets-of-interest in an unknown 3D environment. A key aspect of our approach is an augmented graph that models other robots' trajectories to enable planning for communication and inter-robot collision avoidance. We train our decentralized reinforcement learning policy via the centralized training and decentralized execution paradigm. Once trained, our policy is also scalable to varying number of robots and does not require re-training. Our approach outperforms other state-of-the-art multi-robot target mapping approaches by 33.75% in terms of the number of discovered targets-of-interest. We open-source our code and model at: https://github.com/AccGen99/marl_ipp
Abstract（参考訳）: 自律ロボットは、その効率性と労働コストの低さから、いくつかのマッピングやデータ収集タスクに採用されている。これらのタスクでは、ロボットは経路長やミッションタイムなどのリソース予算に制約を課しながら、未知の環境における関心のターゲットをマッピングする必要がある。これは、各ロボットが環境中の静的障害物から衝突を検出し、回避するだけでなく、ロボット同士の衝突を避けるために、他のロボットの軌道をモデル化する必要があるため、難しい問題である。本研究では,未知の3次元環境における関心のターゲットをマップするマルチロボット情報経路計画のための新しい深層強化学習手法を提案する。我々のアプローチの重要な側面は、他のロボットの軌道をモデル化し、通信計画とロボット間衝突回避を可能にする拡張グラフである。我々は、集中型学習と分散型実行パラダイムを通じて、分散化された強化学習政策を訓練する。トレーニングが完了すると、ポリシーはさまざまなロボットにスケーラブルになり、再トレーニングは不要になります。提案手法は,他の最先端のマルチロボット目標マッピング手法よりも33.75%向上する。私たちは、コードとモデルをhttps://github.com/AccGen99/marl_ippでオープンソース化しました。

関連論文リスト

Generalizability of Graph Neural Networks for Decentralized Unlabeled Motion Planning [72.86540018081531]
ラベルなしの動作計画では、衝突回避を確保しながら、ロボットのセットを目標の場所に割り当てる。この問題は、探査、監視、輸送などの応用において、マルチロボットシステムにとって不可欠なビルディングブロックを形成している。この問題に対処するために、各ロボットは、その400ドルのアネレストロボットと$k$アネレストターゲットの位置のみを知っている分散環境で対処する。
論文参考訳（メタデータ） (2024-09-29T23:57:25Z)
Robotic warehousing operations: a learn-then-optimize approach to large-scale neighborhood search [84.39855372157616]
本稿では,ワークステーションの注文処理,アイテムポッドの割り当て,ワークステーションでの注文処理のスケジュールを最適化することで,ウェアハウジングにおけるロボット部品対ピッカー操作を支援する。そこで我々は, 大規模近傍探索を用いて, サブプロブレム生成に対する学習を最適化する手法を提案する。 Amazon Roboticsと共同で、我々のモデルとアルゴリズムは、最先端のアプローチよりも、実用的な問題に対するより強力なソリューションを生み出していることを示す。
論文参考訳（メタデータ） (2024-08-29T20:22:22Z)
Online Concurrent Multi-Robot Coverage Path Planning [5.801044612920816]
地平線では、経路計画と経路実行がインターリーブであり、経路のないロボットが経路計画を行う場合、優れた経路を持つロボットは実行しない。地平線をベースとしない集中型アルゴリズムを提案する。事前に割り当てられた目標に到達したロボットのサブセットに対して、いつでもパスを計画し、残りは傑出したパスを実行する。
論文参考訳（メタデータ） (2024-03-15T16:51:30Z)
Deep Reinforcement Learning with Dynamic Graphs for Adaptive Informative Path Planning [22.48658555542736]
ロボットデータ取得における重要な課題は、当初未知の環境を抜けて観測を収集する計画経路である。そこで本研究では,未知の3D環境において,ロボット経路を適応的に計画し,対象をマップする深層強化学習手法を提案する。
論文参考訳（メタデータ） (2024-02-07T14:24:41Z)
Scalable Multi-robot Motion Planning for Congested Environments With Topological Guidance [2.846144602096543]
マルチロボットモーションプランニング(MRMP)は、連続状態空間におけるロボットの衝突のない経路を見つける問題である。我々は、トポロジカルガイダンスによって提供される改善された効率を活用するために、既存のシングルロボットモーションプランニング手法を拡張した。提案手法は,多くの狭い経路を持つ複雑な環境における経路を効率的に計画する能力を示し,既存の方法の最大25倍の大きさのロボットチームに拡張する。
論文参考訳（メタデータ） (2022-10-13T16:26:01Z)
DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文参考訳（メタデータ） (2022-09-07T00:35:27Z)
Learning to Coordinate for a Worker-Station Multi-robot System in Planar Coverage Tasks [16.323122275188354]
ランダムな動的干渉器を有する大規模平面領域におけるマルチロボットカバレッジパス計画問題に着目する。本稿では,実際の作業に必要なリソースが限られている複数の作業者と,資源補給に十分なリソースを持つ1つのステーションからなる作業者ステーションMSSを紹介する。本稿では、労働者のカバレッジプランニングと駅のランデブープランニングを同時に解決する、エンドツーエンドの分散オンラインプランニング手法を提案する。
論文参考訳（メタデータ） (2022-08-05T05:36:42Z)
Intention Aware Robot Crowd Navigation with Attention-Based Interaction Graph [3.8461692052415137]
本研究では,高密度で対話的な群集における安全かつ意図に配慮したロボットナビゲーションの課題について検討する。本稿では,エージェント間の異種相互作用を捕捉するアテンション機構を備えた新しいグラフニューラルネットワークを提案する。提案手法は,群集ナビゲーションのシナリオにおいて,優れたナビゲーション性能と非侵襲性をロボットが実現できることを実証する。
論文参考訳（メタデータ） (2022-03-03T16:26:36Z)
REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文参考訳（メタデータ） (2022-02-10T18:50:25Z)
SABER: Data-Driven Motion Planner for Autonomously Navigating Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文参考訳（メタデータ） (2021-08-03T02:56:21Z)
Graph Neural Networks for Decentralized Multi-Robot Submodular Action Selection [101.38634057635373]
ロボットがチームサブモジュールの目的を最大化するために共同で行動を選択する必要があるアプリケーションに焦点を当てる。分散通信によるサブモジュール化に向けた汎用学習アーキテクチャを提案する。大規模ロボットネットワークによるアクティブターゲットカバレッジのシナリオにおいて、GNNベースの学習アプローチのパフォーマンスを実証します。
論文参考訳（メタデータ） (2021-05-18T15:32:07Z)
Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文参考訳（メタデータ） (2021-03-05T14:16:20Z)
Large Scale Distributed Collaborative Unlabeled Motion Planning with Graph Policy Gradients [122.85280150421175]
本研究では,運動制約と空間制約を多数のロボットに対して2次元空間で解くための学習法を提案する。ロボットのポリシーをパラメータ化するためにグラフニューラルネットワーク(GNN)を用いる。
論文参考訳（メタデータ） (2021-02-11T21:57:43Z)
Autonomous Navigation in Dynamic Environments: Deep Learning-Based Approach [0.0]
本論文は,各スキームの長所と短所を浮き彫りにした深層学習に基づくアプローチを考察する。畳み込みニューラルネットワーク(CNN)に基づくディープラーニング手法の1つは、ソフトウェア実装によって実現される。本研究では, レーザースキャナの代わりに単眼カメラを使用するという基礎から, レストラン, 博物館などの屋内アプリケーションに対して, 低コストなアプローチを提案する。
論文参考訳（メタデータ） (2021-02-03T23:20:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。