論文の概要: Learning to Communicate Locally for Large-Scale Multi-Agent Pathfinding
- arxiv url: http://arxiv.org/abs/2605.07637v2
- Date: Tue, 12 May 2026 12:34:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 18:21:06.826984
- Title: Learning to Communicate Locally for Large-Scale Multi-Agent Pathfinding
- Title(参考訳): 大規模マルチエージェントパスフィニングのための局所通信学習
- Authors: Valeriy Vyaltsev, Alsu Sagirova, Anton Andreychuk, Oleg Bulichev, Yuri Kuratov, Konstantin Yakovlev, Aleksandr Panov, Alexey Skrynnik,
- Abstract要約: 本稿では,効率的な特徴共有を通じてエージェント間の協調を強化するための学習可能な通信モジュールを提案する。
提案手法は既存の学習ベースMAPFソルバよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 48.1609560841622
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent pathfinding (MAPF) is a widely used abstraction for multi-robot trajectory planning problems, where multiple homogeneous agents move simultaneously within a shared environment. Although solving MAPF optimally is NP-hard, scalable and efficient solvers are critical for real-world applications such as logistics and search-and-rescue. To this end, the research community has proposed various decentralized suboptimal MAPF solvers that leverage machine learning. Such methods frame MAPF (from a single agent perspective) as a Dec-POMDP where at each time step an agent has to decide an action based on the local observation and typically solve the problem via reinforcement learning or imitation learning. We follow the same approach but additionally introduce a learnable communication module tailored to enhance cooperation between agents via efficient feature sharing. We present the Local Communication for Multi-agent Pathfinding (LC-MAPF), a generalizable pre-trained model that applies multi-round communication between neighboring agents to exchange information and improve their coordination. Our experiments show that the introduced method outperforms the existing learning-based MAPF solvers, including IL and RL-based approaches, across diverse metrics in a diverse range of (unseen) test scenarios. Remarkably, the introduced communication mechanism does not compromise LC-MAPF's scalability, a common bottleneck for communication-based MAPF solvers.
- Abstract(参考訳): マルチエージェントパスフィンディング(MAPF)は、複数の均質エージェントが共有環境内で同時に移動するマルチロボット軌道計画問題に対して広く用いられている抽象化である。
MAPFを最適に解くことはNPハードであるが、スケーラブルで効率的な解法はロジスティクスやサーチ・アンド・レスキューのような現実世界のアプリケーションには不可欠である。
この目的のために、研究コミュニティは機械学習を活用する様々な分散化された準最適MAPFソルバを提案している。
このような手法は、(単一のエージェントの観点から)Dec-POMDPとして、各ステップでエージェントが局所的な観察に基づいて行動を決定し、典型的には強化学習や模倣学習を通じて問題を解く必要がある。
我々は同じアプローチを踏襲するが、効率的な機能共有を通じてエージェント間の協調を強化するための学習可能な通信モジュールも導入する。
本稿では,近隣エージェント間のマルチラウンド通信を適用して情報交換を行い,協調性を向上させる汎用型事前学習モデルであるLC-MAPFを提案する。
提案手法は,IL や RL など,既存の学習型MAPF 解法よりも優れており,様々な(目に見えない)テストシナリオにおいて,多種多様なメトリクスにまたがっている。
注目すべきは、この通信機構がLC-MAPFのスケーラビリティを損なわないことだ。
関連論文リスト
- MO-MIX: Multi-Objective Multi-Agent Cooperative Decision-Making With Deep Reinforcement Learning [68.91090643731987]
深部強化学習(RL)は複雑な意思決定問題を解決するために広く応用されている。
既存のアプローチは、別々のフィールドに限られており、単一の目的でマルチエージェントの意思決定しか処理できない。
マルチオブジェクト型マルチエージェント強化学習(MOMARL)問題の解法としてMO-mixを提案する。
論文 参考訳(メタデータ) (2026-02-28T16:25:22Z) - PC2P: Multi-Agent Path Finding via Personalized-Enhanced Communication and Crowd Perception [12.114711272142031]
PC2Pは、QラーニングベースのMARLフレームワークから派生した、新しい分散MAPF手法である。
動的グラフトポロジに基づくパーソナライズされたコミュニケーション機構を提案する。
致命的なデッドロック問題を解決するために,我々は地域ベースのデッドロック破滅戦略を提案する。
論文 参考訳(メタデータ) (2026-01-06T03:11:26Z) - Sequence Pathfinder for Multi-Agent Pickup and Delivery in the Warehouse [10.576983033957953]
Multi-Agent Pickup and Delivery (MAPD) は Multi-Agent Path Finding (MAPF) の挑戦的拡張である
コミュニケーション学習は、グローバルな情報の欠如を緩和するが、ポイントツーポイント通信による高い計算複雑性をもたらす。
本稿では,暗黙的な情報交換を実現するためのシークエンシャルパスファインダ(SePar)を提案する。
論文 参考訳(メタデータ) (2025-09-28T09:48:13Z) - SIGMA: Sheaf-Informed Geometric Multi-Agent Pathfinding [11.38008343729117]
多エージェントパス探索問題は、大規模物流および輸送におけるロボット展開における中核的な課題である。
分散化深層学習にせん断理論を適用した新しい枠組みを導入する。
提案手法は、最先端の学習ベースMAPFプランナよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2025-02-10T13:17:34Z) - Ensembling Prioritized Hybrid Policies for Multi-agent Pathfinding [18.06081009550052]
MARL(Multi-Agent Reinforcement Learning)をベースとしたMAPF(Multi-Agent Path Finding)が最近注目されている。
いくつかのMARL-MAPFメソッドは、あるエージェントが知覚できる情報を豊かにするためにコミュニケーションを使用する。
優先度付きハイブリッドポリシ(EPH)を組み込む新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-12T11:47:12Z) - Locality Matters: A Scalable Value Decomposition Approach for
Cooperative Multi-Agent Reinforcement Learning [52.7873574425376]
協調型マルチエージェント強化学習(MARL)は,エージェント数で指数関数的に大きい状態空間と動作空間により,スケーラビリティの問題に直面する。
本稿では,学習分散実行パラダイムに局所報酬を組み込んだ,新しい価値に基づくマルチエージェントアルゴリズム LOMAQ を提案する。
論文 参考訳(メタデータ) (2021-09-22T10:08:15Z) - Dif-MAML: Decentralized Multi-Agent Meta-Learning [54.39661018886268]
我々は,MAML や Dif-MAML と呼ばれる協調型マルチエージェントメタ学習アルゴリズムを提案する。
提案手法により, エージェントの集合が線形速度で合意に達し, 集約MAMLの定常点に収束できることを示す。
シミュレーションの結果は従来の非協調的な環境と比較して理論的な結果と優れた性能を示している。
論文 参考訳(メタデータ) (2020-10-06T16:51:09Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。