論文の概要: Subdimensional Expansion Using Attention-Based Learning For Multi-Agent
Path Finding
- arxiv url: http://arxiv.org/abs/2109.14695v1
- Date: Wed, 29 Sep 2021 20:01:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 14:45:39.310927
- Title: Subdimensional Expansion Using Attention-Based Learning For Multi-Agent
Path Finding
- Title(参考訳): マルチエージェントパス探索のための注意型学習による部分次元拡大
- Authors: Lakshay Virmani, Zhongqiang Ren, Sivakumar Rathinam and Howie Choset
- Abstract要約: MAPF(Multi-Agent Path Finding)は、各開始点から目標地点までの複数のエージェントに対する競合のないパスを見つける。
我々は、この学習に基づくシングルエージェントプランナーをM*に統合することにより、LM*と呼ばれる新しいマルチエージェントプランナーを開発する。
以上の結果から,M* と比較した場合,LM* はコンフリクトが少なく,高速に動作し,高い成功率を享受できることがわかった。
- 参考スコア(独自算出の注目度): 9.2127262112464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-Agent Path Finding (MAPF) finds conflict-free paths for multiple agents
from their respective start to goal locations. MAPF is challenging as the joint
configuration space grows exponentially with respect to the number of agents.
Among MAPF planners, search-based methods, such as CBS and M*, effectively
bypass the curse of dimensionality by employing a dynamically-coupled strategy:
agents are planned in a fully decoupled manner at first, where potential
conflicts between agents are ignored; and then agents either follow their
individual plans or are coupled together for planning to resolve the conflicts
between them. In general, the number of conflicts to be resolved decides the
run time of these planners and most of the existing work focuses on how to
efficiently resolve these conflicts. In this work, we take a different view and
aim to reduce the number of conflicts (and thus improve the overall search
efficiency) by improving each agent's individual plan. By leveraging a Visual
Transformer, we develop a learning-based single-agent planner, which plans for
a single agent while paying attention to both the structure of the map and
other agents with whom conflicts may happen. We then develop a novel
multi-agent planner called LM* by integrating this learning-based single-agent
planner with M*. Our results show that for both "seen" and "unseen" maps, in
comparison with M*, LM* has fewer conflicts to be resolved and thus, runs
faster and enjoys higher success rates. We empirically show that MAPF solutions
computed by LM* are near-optimal. Our code is available at
https://github.com/lakshayvirmani/learning-assisted-mstar .
- Abstract(参考訳): MAPF(Multi-Agent Path Finding)は、各開始点から目標地点までの複数のエージェントに対する競合のないパスを見つける。
MAPFは、エージェントの数に関して、共同構成空間が指数関数的に増加するにつれて困難である。
MAPFプランナーの中で、CBSやM*のような検索ベースの手法は、動的に結合された戦略を用いて、次元の呪いを効果的に回避する:エージェントは、エージェント間の潜在的な衝突が無視される完全に分離された方法で計画される。
一般に、解決すべき紛争の数は、これらのプランナーの実行時間を決定し、既存の作業のほとんどは、これらの紛争を効率的に解決する方法に焦点を当てている。
本研究は,各エージェントの個々の計画を改善することにより,コンフリクト数を削減し,検索効率を向上させることを目的としている。
視覚トランスフォーマーを利用することで,学習ベースの単一エージェントプランナを開発し,地図の構造と衝突の可能性のある他のエージェントの両方に注意を払いながら,単一のエージェントを計画する。
次に、この学習に基づく単一エージェントプランナをM*に統合することにより、LM*と呼ばれる新しいマルチエージェントプランナを開発する。
以上の結果から, m* と比較すると, lm* はより少ないコンフリクトを持つため, より高速に動作し, 高い成功率を享受できることがわかった。
LM*によって計算されたMAPF解がほぼ最適であることを示す。
私たちのコードはhttps://github.com/lakshayvirmani/learning-assisted-mstarで利用可能です。
関連論文リスト
- Cooperative Reward Shaping for Multi-Agent Pathfinding [4.244426154524592]
MAPF(Multi-Agent Pathfinding)の主な目的は、全てのエージェントに対して効率的で競合のないパスを計画することである。
従来のマルチエージェントパス計画アルゴリズムは、複数のエージェントに対して効率的な分散パス計画を実現するのに苦労する。
独立Q-Learning(IQL)に基づく独自の報酬形成手法を紹介する。
論文 参考訳(メタデータ) (2024-07-15T02:44:41Z) - Scalable Mechanism Design for Multi-Agent Path Finding [87.40027406028425]
MAPF (Multi-Agent Path Finding) は、複数のエージェントが同時に移動し、与えられた目標地点に向かって共有領域を通って衝突しない経路を決定する。
最適解を見つけることは、しばしば計算不可能であり、近似的な準最適アルゴリズムを用いることが不可欠である。
本稿では、MAPFのスケーラブルな機構設計の問題を紹介し、MAPFアルゴリズムを近似した3つの戦略防御機構を提案する。
論文 参考訳(メタデータ) (2024-01-30T14:26:04Z) - Decentralized Monte Carlo Tree Search for Partially Observable
Multi-agent Pathfinding [49.730902939565986]
マルチエージェントパスフィンディング問題は、グラフに閉じ込められたエージェントのグループに対するコンフリクトフリーパスのセットを見つけることである。
本研究では、エージェントが他のエージェントをローカルにのみ観察できる分散MAPF設定に焦点を当てた。
MAPFタスクのための分散マルチエージェントモンテカルロ木探索法を提案する。
論文 参考訳(メタデータ) (2023-12-26T06:57:22Z) - Learn to Follow: Decentralized Lifelong Multi-agent Pathfinding via
Planning and Learning [46.354187895184154]
マルチエージェントパスフィンディング(MAPF)問題は通常、グラフに制限されたエージェントの集合に対する競合のないパスの集合を見つけるよう要求する。
本研究では,エージェントの位置や目標に関する情報をすべて収集する中央制御器が存在しない場合の分散MAPF設定について検討する。
我々は,先行するエージェントに新たな目標を連続的に割り当てることを含むMAPFの実用上重要な寿命変化に焦点をあてる。
論文 参考訳(メタデータ) (2023-10-02T13:51:32Z) - Traffic Flow Optimisation for Lifelong Multi-Agent Path Finding [29.76466191644455]
MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題であり、エージェントのチームに対して衝突のない経路の計算を求める。
本稿では,MAPFにエージェントを誘導する手法を提案する。
各エージェントが1つの宛先を持つワンショットMAPFと、エージェントが常に新しい宛先を割り当てる終身MAPFの2つの大規模設定でこのアイデアを評価する。
論文 参考訳(メタデータ) (2023-08-22T07:17:39Z) - Monte-Carlo Tree Search for Multi-Agent Pathfinding: Preliminary Results [60.4817465598352]
マルチエージェントパスフィンディングに適したモンテカルロ木探索(MCTS)のオリジナル版を紹介する。
具体的には,エージェントの目標達成行動を支援するために,個別の経路を用いる。
また,木探索手順の分岐係数を低減するために,専用の分解手法を用いる。
論文 参考訳(メタデータ) (2023-07-25T12:33:53Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
拡散モデル(DM)は、最近オフライン強化学習を含む様々なシナリオで大きな成功を収めた。
この問題に対処する新しい生成型マルチエージェント学習フレームワークであるMADiffを提案する。
本実験は,マルチエージェント学習タスクにおけるベースラインアルゴリズムと比較して,MADiffの優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - Decentralised Approach for Multi Agent Path Finding [6.599344783327053]
MAPF (Multi Agent Path Finding) は、空間的に拡張されたエージェントに対する競合のない経路の同定を必要とする。
これらは、Convoy Movement ProblemやTraning Schedulingといった現実世界の問題に適用できる。
提案手法であるDecentralized Multi Agent Path Finding (DeMAPF) は、MAPFを経路計画と割り当ての問題の系列として扱う。
論文 参考訳(メタデータ) (2021-06-03T18:07:26Z) - Dynamic Multi-Agent Path Finding based on Conflict Resolution using
Answer Set Programming [0.0]
コンフリクト分解能に基づくD-MAPFの解法を提案する。
アイデアは、新しいエージェントがチームに加わり、チーム全体を計画する代わりに競合が存在するとき、計画が互いに矛盾するエージェントの最小限のサブセットのためにのみ計画する、というものだ。
論文 参考訳(メタデータ) (2020-09-22T00:50:35Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。