Fugu-MT 論文翻訳(概要): Multi-robot Social-aware Cooperative Planning in Pedestrian Environments Using Multi-agent Reinforcement Learning

論文の概要: Multi-robot Social-aware Cooperative Planning in Pedestrian Environments Using Multi-agent Reinforcement Learning

arxiv url: http://arxiv.org/abs/2211.15901v1
Date: Tue, 29 Nov 2022 03:38:47 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-30 17:06:23.942195
Title: Multi-robot Social-aware Cooperative Planning in Pedestrian Environments Using Multi-agent Reinforcement Learning
Title（参考訳）: マルチエージェント強化学習を用いた歩行者環境におけるマルチロボットソーシャルアウェア協調計画
Authors: Zichen He and Chunwei Song and Lu Dong
Abstract要約: 我々は、非政治的マルチエージェント強化学習(MARL)に基づく、新しいマルチロボット・ソーシャル・アウェア・効率的な協調プランナーを提案する。我々は、時間空間グラフ(TSG)に基づくソーシャルエンコーダを採用し、その視野における各ロボットと歩行者の社会的関係の重要性をよりよく抽出する。
参考スコア（独自算出の注目度）: 2.7716102039510564
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Safe and efficient co-planning of multiple robots in pedestrian participation environments is promising for applications. In this work, a novel multi-robot social-aware efficient cooperative planner that on the basis of off-policy multi-agent reinforcement learning (MARL) under partial dimension-varying observation and imperfect perception conditions is proposed. We adopt temporal-spatial graph (TSG)-based social encoder to better extract the importance of social relation between each robot and the pedestrians in its field of view (FOV). Also, we introduce K-step lookahead reward setting in multi-robot RL framework to avoid aggressive, intrusive, short-sighted, and unnatural motion decisions generated by robots. Moreover, we improve the traditional centralized critic network with multi-head global attention module to better aggregates local observation information among different robots to guide the process of individual policy update. Finally, multi-group experimental results verify the effectiveness of the proposed cooperative motion planner.
Abstract（参考訳）: 歩行者参加環境における複数ロボットの安全かつ効率的な協調計画は、応用に有望である。本研究では,部分的次元変動観測と不完全な知覚条件下でのマルチエージェント強化学習(marl)に基づく,新しいマルチロボットソーシャルアウェアな協調プランナーを提案する。本研究では、時間空間グラフに基づくソーシャルエンコーダを用いて、各ロボットと歩行者の視点(FOV)における社会的関係の重要性をよりよく抽出する。また,ロボットによる攻撃的,侵入的,近視的,不自然な動作決定を回避するため,マルチロボットRLフレームワークにKステップのルックアヘッド報酬設定を導入する。さらに,マルチヘッドグローバルアテンションモジュールによる従来型の中央集権的批評家ネットワークを改善し,各ロボット間の局所的な観察情報をよりよく集約し,個別ポリシー更新のプロセスを導く。最後に, 多群実験により, 提案する協調運動プランナーの有効性を検証した。

関連論文リスト

Generalizability of Graph Neural Networks for Decentralized Unlabeled Motion Planning [72.86540018081531]
ラベルなしの動作計画では、衝突回避を確保しながら、ロボットのセットを目標の場所に割り当てる。この問題は、探査、監視、輸送などの応用において、マルチロボットシステムにとって不可欠なビルディングブロックを形成している。この問題に対処するために、各ロボットは、その400ドルのアネレストロボットと$k$アネレストターゲットの位置のみを知っている分散環境で対処する。
論文参考訳（メタデータ） (2024-09-29T23:57:25Z)
GSON: A Group-based Social Navigation Framework with Large Multimodal Model [9.94576166903495]
移動ロボットが周囲の社会集団を知覚し利用できるようにするためのグループベースのソーシャルナビゲーションフレームワークGSONを提案する。認識のために、歩行者間の社会的関係をゼロショットで抽出する視覚的プロンプト技術を適用した。計画には,グローバルパス計画とローカルモーションプランニングの橋渡しとして,社会構造に基づく中間プランナを採用する。
論文参考訳（メタデータ） (2024-09-26T17:27:15Z)
A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements [51.54559117314768]
タスク・アンド・モーション・プランニング(タスク・アンド・モーション・プランニング、TAMP)は、自動化された計画問題の解決策を見つけるための問題である。本稿では,TAMP問題のモデル化とベンチマークを行うための,汎用的でオープンソースのフレームワークを提案する。移動エージェントと複数のタスク状態依存障害を含むTAMP問題を解決する革新的なメタ技術を導入する。
論文参考訳（メタデータ） (2024-08-11T14:57:57Z)
Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文参考訳（メタデータ） (2024-01-22T18:58:22Z)
LPAC: Learnable Perception-Action-Communication Loops with Applications to Coverage Control [80.86089324742024]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。 CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文参考訳（メタデータ） (2024-01-10T00:08:00Z)
Learning to Coordinate for a Worker-Station Multi-robot System in Planar Coverage Tasks [16.323122275188354]
ランダムな動的干渉器を有する大規模平面領域におけるマルチロボットカバレッジパス計画問題に着目する。本稿では,実際の作業に必要なリソースが限られている複数の作業者と,資源補給に十分なリソースを持つ1つのステーションからなる作業者ステーションMSSを紹介する。本稿では、労働者のカバレッジプランニングと駅のランデブープランニングを同時に解決する、エンドツーエンドの分散オンラインプランニング手法を提案する。
論文参考訳（メタデータ） (2022-08-05T05:36:42Z)
Distributed Reinforcement Learning for Robot Teams: A Review [10.92709534981466]
近年のセンサ,アクティベーション,計算の進歩により,マルチロボットシステムへの扉が開きつつある。コミュニティはモデルフリーのマルチエージェント強化学習を活用して、マルチロボットシステムのための効率的でスケーラブルなコントローラを開発した。最近の知見:分散MSSは、非定常性や部分観測可能性などの根本的な課題に直面している。
論文参考訳（メタデータ） (2022-04-07T15:34:19Z)
HARPS: An Online POMDP Framework for Human-Assisted Robotic Planning and Sensing [1.3678064890824186]
HARPS(Human Assisted Robotic Planning and Sensing)フレームワークは、ロボットチームにおけるアクティブなセマンティックセンシングと計画のためのフレームワークである。このアプローチにより、人間が不規則にモデル構造を強制し、不確実な環境で意味的なソフトデータの範囲を拡張することができる。大規模部分構造環境におけるUAV対応ターゲット探索アプリケーションのシミュレーションは、時間と信念状態の推定において著しく改善されている。
論文参考訳（メタデータ） (2021-10-20T00:41:57Z)
Decentralized Global Connectivity Maintenance for Multi-Robot Navigation: A Reinforcement Learning Approach [12.649986200029717]
本研究では、接続性を維持しながら、未知の環境でマルチロボットチームをナビゲートする方法を検討する。複数のロボット間で共有される分散型ポリシーを開発するための強化学習手法を提案する。接続制約と行動クローニングの異なる組み合わせを比較することで,提案手法の有効性を検証した。
論文参考訳（メタデータ） (2021-09-17T13:20:19Z)
SABER: Data-Driven Motion Planner for Autonomously Navigating Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文参考訳（メタデータ） (2021-08-03T02:56:21Z)
Graph Neural Networks for Decentralized Multi-Robot Submodular Action Selection [101.38634057635373]
ロボットがチームサブモジュールの目的を最大化するために共同で行動を選択する必要があるアプリケーションに焦点を当てる。分散通信によるサブモジュール化に向けた汎用学習アーキテクチャを提案する。大規模ロボットネットワークによるアクティブターゲットカバレッジのシナリオにおいて、GNNベースの学習アプローチのパフォーマンスを実証します。
論文参考訳（メタデータ） (2021-05-18T15:32:07Z)
Where to go next: Learning a Subgoal Recommendation Policy for Navigation Among Pedestrians [40.58684597726312]
モデル予測制御(MPC)のような局所軌道最適化手法は、これらの変化に対処できるが、大域的なガイダンスを必要とする。本稿では,地域プランナーに長期指導を提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
論文参考訳（メタデータ） (2021-02-25T18:41:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。