論文の概要: RAILGUN: A Unified Convolutional Policy for Multi-Agent Path Finding Across Different Environments and Tasks
- arxiv url: http://arxiv.org/abs/2503.02992v1
- Date: Tue, 04 Mar 2025 20:35:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-06 15:51:27.847731
- Title: RAILGUN: A Unified Convolutional Policy for Multi-Agent Path Finding Across Different Environments and Tasks
- Title(参考訳): RAILGUN:異なる環境・課題にまたがるマルチエージェントパスの統一的畳み込み政策
- Authors: Yimin Tang, Xiao Xiong, Jingyi Xi, Jiaoyang Li, Erdem Bıyık, Sven Koenig,
- Abstract要約: Multi-Agent Path Finding (MAPF) は、空中スワムから倉庫の自動化まで、様々な用途に欠かせない。
我々はRAILGUNと呼ばれるMAPF問題に対する最初の集中型学習ベースのポリシーを開発した。
CNNベースのアーキテクチャを活用することで、RAILGUNはさまざまなマップをまたいで一般化し、任意の数のエージェントを処理することができる。
- 参考スコア(独自算出の注目度): 17.17370365888357
- License:
- Abstract: Multi-Agent Path Finding (MAPF), which focuses on finding collision-free paths for multiple robots, is crucial for applications ranging from aerial swarms to warehouse automation. Solving MAPF is NP-hard so learning-based approaches for MAPF have gained attention, particularly those leveraging deep neural networks. Nonetheless, despite the community's continued efforts, all learning-based MAPF planners still rely on decentralized planning due to variability in the number of agents and map sizes. We have developed the first centralized learning-based policy for MAPF problem called RAILGUN. RAILGUN is not an agent-based policy but a map-based policy. By leveraging a CNN-based architecture, RAILGUN can generalize across different maps and handle any number of agents. We collect trajectories from rule-based methods to train our model in a supervised way. In experiments, RAILGUN outperforms most baseline methods and demonstrates great zero-shot generalization capabilities on various tasks, maps and agent numbers that were not seen in the training dataset.
- Abstract(参考訳): 複数のロボットの衝突のない経路を見つけることに焦点を当てたMulti-Agent Path Finding (MAPF)は、空中群から倉庫の自動化まで、アプリケーションにとって不可欠である。
MAPFの解決はNPハードであるため、MAPFの学習に基づくアプローチが注目されている。
それでも、コミュニティの継続的な努力にもかかわらず、学習ベースのMAPFプランナーは、エージェントの数やマップサイズの変化により、依然として分散計画に依存している。
我々はRAILGUNと呼ばれるMAPF問題に対する最初の集中型学習ベースのポリシーを開発した。
RAILGUNはエージェントベースのポリシーではなく、マップベースのポリシーである。
CNNベースのアーキテクチャを活用することで、RAILGUNはさまざまなマップをまたいで一般化し、任意の数のエージェントを処理することができる。
ルールベースの手法からトラジェクトリを収集し、教師付き方法でモデルをトレーニングします。
実験では、RAILGUNは、ほとんどのベースライン手法より優れており、トレーニングデータセットでは見られなかった様々なタスク、マップ、エージェント番号に対して、優れたゼロショット一般化能力を示す。
関連論文リスト
- MAPF-GPT: Imitation Learning for Multi-Agent Pathfinding at Scale [46.35418789518417]
MAPF(Multi-agent pathfinding)は、一般に、共有環境において複数のエージェントに対して衝突のない経路を見つけることを必要とする問題である。
近年、MAPFへの学習に基づくアプローチが注目されており、特に深層強化学習を活用している。
MAPF-GPTは,多種多様な問題インスタンスにおいて,現在最も優れた学習可能なMAPFソルバよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-08-29T12:55:10Z) - Improving Learnt Local MAPF Policies with Heuristic Search [24.06091123268885]
MAPF (Multi-Adnt Path Finding) は、エージェントのチームが目標地点に到達するための衝突のない経路を見つける問題である。
MAPFに対する現在の機械学習アプローチでは、このポテンシャルの表面を掻き傷始めた手法が提案されている。
我々は,学習ポリシーを用いた検索のモデルに依存しないいくつかの方法を示し,政策の成功率とスケーラビリティを著しく向上させる。
論文 参考訳(メタデータ) (2024-03-29T17:16:20Z) - Scalable Mechanism Design for Multi-Agent Path Finding [87.40027406028425]
MAPF (Multi-Agent Path Finding) は、複数のエージェントが同時に移動し、与えられた目標地点に向かって共有領域を通って衝突しない経路を決定する。
最適解を見つけることは、しばしば計算不可能であり、近似的な準最適アルゴリズムを用いることが不可欠である。
本稿では、MAPFのスケーラブルな機構設計の問題を紹介し、MAPFアルゴリズムを近似した3つの戦略防御機構を提案する。
論文 参考訳(メタデータ) (2024-01-30T14:26:04Z) - Decentralized Monte Carlo Tree Search for Partially Observable
Multi-agent Pathfinding [49.730902939565986]
マルチエージェントパスフィンディング問題は、グラフに閉じ込められたエージェントのグループに対するコンフリクトフリーパスのセットを見つけることである。
本研究では、エージェントが他のエージェントをローカルにのみ観察できる分散MAPF設定に焦点を当てた。
MAPFタスクのための分散マルチエージェントモンテカルロ木探索法を提案する。
論文 参考訳(メタデータ) (2023-12-26T06:57:22Z) - Learn to Follow: Decentralized Lifelong Multi-agent Pathfinding via
Planning and Learning [46.354187895184154]
マルチエージェントパスフィンディング(MAPF)問題は通常、グラフに制限されたエージェントの集合に対する競合のないパスの集合を見つけるよう要求する。
本研究では,エージェントの位置や目標に関する情報をすべて収集する中央制御器が存在しない場合の分散MAPF設定について検討する。
我々は,先行するエージェントに新たな目標を連続的に割り当てることを含むMAPFの実用上重要な寿命変化に焦点をあてる。
論文 参考訳(メタデータ) (2023-10-02T13:51:32Z) - Traffic Flow Optimisation for Lifelong Multi-Agent Path Finding [29.76466191644455]
MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題であり、エージェントのチームに対して衝突のない経路の計算を求める。
本稿では,MAPFにエージェントを誘導する手法を提案する。
各エージェントが1つの宛先を持つワンショットMAPFと、エージェントが常に新しい宛先を割り当てる終身MAPFの2つの大規模設定でこのアイデアを評価する。
論文 参考訳(メタデータ) (2023-08-22T07:17:39Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
MADiffは拡散型マルチエージェント学習フレームワークである。
分散ポリシと集中型コントローラの両方として機能する。
実験の結果,MADiffは様々なマルチエージェント学習タスクにおいて,ベースラインアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - Learning From Good Trajectories in Offline Multi-Agent Reinforcement
Learning [98.07495732562654]
オフラインマルチエージェント強化学習(MARL)は、事前コンパイルされたデータセットから効果的なマルチエージェントポリシーを学ぶことを目的としている。
オフラインのMARLが学んだエージェントは、しばしばこのランダムなポリシーを継承し、チーム全体のパフォーマンスを脅かす。
この問題に対処するために,共有個人軌道(SIT)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-28T18:11:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。