論文の概要: Decentralized Global Connectivity Maintenance for Multi-Robot
Navigation: A Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2109.08536v1
- Date: Fri, 17 Sep 2021 13:20:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-20 14:29:24.134743
- Title: Decentralized Global Connectivity Maintenance for Multi-Robot
Navigation: A Reinforcement Learning Approach
- Title(参考訳): マルチロボットナビゲーションのための分散グローバル接続メンテナンス:強化学習アプローチ
- Authors: Minghao Li, Yingrui Jie, Yang Kong, Hui Cheng
- Abstract要約: 本研究では、接続性を維持しながら、未知の環境でマルチロボットチームをナビゲートする方法を検討する。
複数のロボット間で共有される分散型ポリシーを開発するための強化学習手法を提案する。
接続制約と行動クローニングの異なる組み合わせを比較することで,提案手法の有効性を検証した。
- 参考スコア(独自算出の注目度): 12.649986200029717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of multi-robot navigation of connectivity maintenance is
challenging in multi-robot applications. This work investigates how to navigate
a multi-robot team in unknown environments while maintaining connectivity. We
propose a reinforcement learning (RL) approach to develop a decentralized
policy, which is shared among multiple robots. Given range sensor measurements
and the positions of other robots, the policy aims to generate control commands
for navigation and preserve the global connectivity of the robot team. We
incorporate connectivity concerns into the RL framework as constraints and
introduce behavior cloning to reduce the exploration complexity of policy
optimization. The policy is optimized with all transition data collected by
multiple robots in random simulated scenarios. We validate the effectiveness of
the proposed approach by comparing different combinations of connectivity
constraints and behavior cloning. We also show that our policy can generalize
to unseen scenarios in both simulation and holonomic robots experiments.
- Abstract(参考訳): 接続性維持のためのマルチロボットナビゲーションの問題は、マルチロボットアプリケーションでは難しい。
この研究は、接続を維持しながら未知の環境でマルチロボットチームをナビゲートする方法を調査します。
複数のロボット間で共有される分散型ポリシーを開発するための強化学習(RL)手法を提案する。
距離センサーと他のロボットの位置を考慮し、ナビゲーションの制御コマンドを生成し、ロボットチームのグローバルな接続性を維持することを目的としている。
我々は、制約としてRLフレームワークに接続性に関する懸念を組み込み、ポリシー最適化の探索複雑性を低減するために行動クローニングを導入する。
このポリシーは、ランダムなシミュレーションシナリオで複数のロボットが収集したすべての遷移データを最適化する。
接続制約と行動クローニングの異なる組み合わせを比較することで,提案手法の有効性を検証した。
また,シミュレーションとホロノミックロボット実験の両方において,我々の方針が未知のシナリオに一般化できることを示した。
関連論文リスト
- Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning [11.134855513221359]
本稿では,多ボット情報経路計画のための新しい深層強化学習手法を提案する。
我々は、集中的な訓練と分散実行パラダイムを通じて強化学習政策を訓練する。
提案手法は,他の最先端のマルチロボット目標マッピング手法よりも33.75%向上する。
論文 参考訳(メタデータ) (2024-09-25T14:27:37Z) - Robotic warehousing operations: a learn-then-optimize approach to large-scale neighborhood search [84.39855372157616]
本稿では,ワークステーションの注文処理,アイテムポッドの割り当て,ワークステーションでの注文処理のスケジュールを最適化することで,ウェアハウジングにおけるロボット部品対ピッカー操作を支援する。
そこで我々は, 大規模近傍探索を用いて, サブプロブレム生成に対する学習を最適化する手法を提案する。
Amazon Roboticsと共同で、我々のモデルとアルゴリズムは、最先端のアプローチよりも、実用的な問題に対するより強力なソリューションを生み出していることを示す。
論文 参考訳(メタデータ) (2024-08-29T20:22:22Z) - LPAC: Learnable Perception-Action-Communication Loops with Applications
to Coverage Control [80.86089324742024]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-01-10T00:08:00Z) - Co-NavGPT: Multi-Robot Cooperative Visual Semantic Navigation using
Large Language Models [10.312968200748118]
Co-NavGPTは、多ボット協調視覚目標ナビゲーションのためのグローバルプランナーとしてLarge Language Modelsを統合する革新的なフレームワークである。
探索された環境データをプロンプトにエンコードし、LLMのシーン理解を強化する。
その後、探索フロンティアを各ロボットに割り当て、効率的な目標探索を行う。
論文 参考訳(メタデータ) (2023-10-11T23:17:43Z) - Robot Fleet Learning via Policy Merging [58.5086287737653]
我々はFLEET-MERGEを提案し、艦隊設定における政策を効率的にマージする。
本稿では,FLEET-MERGEがメタワールド環境における50のタスクで訓練されたポリシーの行動を統合することを示す。
合成・接触に富んだロボット操作タスクにおけるフリートポリシー学習のための新しいロボットツール用ベンチマークであるFLEET-TOOLSを導入する。
論文 参考訳(メタデータ) (2023-10-02T17:23:51Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Polybot: Training One Policy Across Robots While Embracing Variability [70.74462430582163]
複数のロボットプラットフォームにデプロイするための単一のポリシーをトレーニングするための重要な設計決定セットを提案する。
われわれのフレームワークは、まず、手首カメラを利用して、我々のポリシーの観察空間と行動空間を具体化して調整する。
6つのタスクと3つのロボットにまたがる60時間以上のデータセットを用いて,関節の形状や大きさの異なるデータセットの評価を行った。
論文 参考訳(メタデータ) (2023-07-07T17:21:16Z) - Multi-robot Social-aware Cooperative Planning in Pedestrian Environments
Using Multi-agent Reinforcement Learning [2.7716102039510564]
我々は、非政治的マルチエージェント強化学習(MARL)に基づく、新しいマルチロボット・ソーシャル・アウェア・効率的な協調プランナーを提案する。
我々は、時間空間グラフ(TSG)に基づくソーシャルエンコーダを採用し、その視野における各ロボットと歩行者の社会的関係の重要性をよりよく抽出する。
論文 参考訳(メタデータ) (2022-11-29T03:38:47Z) - Intention Aware Robot Crowd Navigation with Attention-Based Interaction
Graph [3.8461692052415137]
本研究では,高密度で対話的な群集における安全かつ意図に配慮したロボットナビゲーションの課題について検討する。
本稿では,エージェント間の異種相互作用を捕捉するアテンション機構を備えた新しいグラフニューラルネットワークを提案する。
提案手法は,群集ナビゲーションのシナリオにおいて,優れたナビゲーション性能と非侵襲性をロボットが実現できることを実証する。
論文 参考訳(メタデータ) (2022-03-03T16:26:36Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。