Fugu-MT 論文翻訳(概要): MAPF-GPT: Imitation Learning for Multi-Agent Pathfinding at Scale

論文の概要: MAPF-GPT: Imitation Learning for Multi-Agent Pathfinding at Scale

arxiv url: http://arxiv.org/abs/2409.00134v3
Date: Wed, 25 Sep 2024 13:09:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-08 03:57:28.060771
Title: MAPF-GPT: Imitation Learning for Multi-Agent Pathfinding at Scale
Title（参考訳）: MAPF-GPT:マルチエージェントパスフィニングにおけるシミュレーション学習
Authors: Anton Andreychuk, Konstantin Yakovlev, Aleksandr Panov, Alexey Skrynnik,
Abstract要約: マルチエージェントパスフィンディング(Multi-agent pathfinding)は、共有環境における複数のエージェントの衝突のないパスを見つけることを必要とする、難しい計算問題である。我々はMAPF-GPTと呼ばれるMAPF問題の基盤モデルを構築した。擬似学習を用いて、部分観測可能性の条件下での行動を生成するための準最適専門家軌道のセットに関する政策を訓練した。 MAPF-GPTは、様々な問題インスタンスにおいて、現在最も優れた学習可能なMAPF解法よりも優れていることを示す。
参考スコア（独自算出の注目度）: 46.35418789518417
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multi-agent pathfinding (MAPF) is a challenging computational problem that typically requires to find collision-free paths for multiple agents in a shared environment. Solving MAPF optimally is NP-hard, yet efficient solutions are critical for numerous applications, including automated warehouses and transportation systems. Recently, learning-based approaches to MAPF have gained attention, particularly those leveraging deep reinforcement learning. Following current trends in machine learning, we have created a foundation model for the MAPF problems called MAPF-GPT. Using imitation learning, we have trained a policy on a set of pre-collected sub-optimal expert trajectories that can generate actions in conditions of partial observability without additional heuristics, reward functions, or communication with other agents. The resulting MAPF-GPT model demonstrates zero-shot learning abilities when solving the MAPF problem instances that were not present in the training dataset. We show that MAPF-GPT notably outperforms the current best-performing learnable-MAPF solvers on a diverse range of problem instances and is efficient in terms of computation (in the inference mode).
Abstract（参考訳）: MAPF(Multi-agent pathfinding)は、共有環境において、複数のエージェントの衝突のない経路を見つけるのが通常である、難しい計算問題である。 MAPFを最適に解くことはNPハードであるが、自動化された倉庫や輸送システムを含む多くのアプリケーションにとって非常に重要である。近年、MAPFへの学習に基づくアプローチが注目されており、特に深層強化学習を活用している。機械学習のトレンドに続き、MAPF-GPTと呼ばれるMAPF問題の基盤モデルを作成しました。模擬学習を用いて、我々は、追加のヒューリスティックや報酬関数、他のエージェントとのコミュニケーションを伴わずに、部分観測可能性の条件下でアクションを生成可能な、事前コンパイルされた準最適専門家軌道のセットに関するポリシーを訓練した。 MAPF-GPTモデルは、トレーニングデータセットに存在しないMAPF問題インスタンスを解く際に、ゼロショット学習能力を示す。 MAPF-GPTは,多種多様な問題インスタンスにおいて,現在最も優れた学習可能なMAPFソルバよりも優れており,(推論モードにおいて)計算の面で効率がよいことを示す。

関連論文リスト

Advancing Learnable Multi-Agent Pathfinding Solvers with Active Fine-Tuning [46.35418789518417]
マルチエージェントパスフィンディング(MAPF)は、マルチロボット軌道計画問題の共通の抽象化である。本稿では,機械学習を活用した分散化サブ最適化MAPFソルバMAPF-GPT-DDGを紹介する。本実験は,MAPF-GPT-DDGが既存の学習型MAPF解法を超えることを示した。
論文参考訳（メタデータ） (2025-06-30T12:34:31Z)
Enhancing Lifelong Multi-Agent Path-finding by Using Artificial Potential Fields [15.082298617948581]
MAPFアルゴリズムにAPFを組み込む手法を提案する。 APFはMAPFにとって有益ではないが、LMAPFのシステム全体のスループットは最大で7倍に向上する。
論文参考訳（メタデータ） (2025-05-28T18:13:10Z)
RAILGUN: A Unified Convolutional Policy for Multi-Agent Path Finding Across Different Environments and Tasks [17.17370365888357]
Multi-Agent Path Finding (MAPF) は、空中スワムから倉庫の自動化まで、様々な用途に欠かせない。我々はRAILGUNと呼ばれるMAPF問題に対する最初の集中型学習ベースのポリシーを開発した。 CNNベースのアーキテクチャを活用することで、RAILGUNはさまざまなマップをまたいで一般化し、任意の数のエージェントを処理することができる。
論文参考訳（メタデータ） (2025-03-04T20:35:20Z)
Transient Multi-Agent Path Finding for Lifelong Navigation in Dense Environments [9.000023855628958]
ライフロングMAPF(英: Lifelong MAPF、LMAPF)は、エージェントが現在のターゲットに到達すると新たなターゲットを受信するMAPFのオンライン版である。そこで本研究では,LMAPF問題に対して,各エージェントが最終的にターゲットを訪問することを目的とした修正MAPF問題の系列を解くことで,LMAPF問題を解くことを提案する。本稿では、このMAPF変種をTransient MAPF (TMAPF) と呼び、既存のMAPFアルゴリズムに基づいたいくつかのアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-12-05T15:37:29Z)
Algorithm Selection for Optimal Multi-Agent Path Finding via Graph Embedding [9.831879504969224]
多エージェント経路探索(MAPF)は、衝突しない複数のエージェントの経路を見つける問題である。 MAPFの最適解を見つけることはNP-Hardであるが、現代の最適解法は数百のエージェントにスケールでき、場合によっては数千までスケールできる。このエンコーディングが既存のエンコーディングと効果的に結合できることを示し、その結果、グラフ埋め込みによるMAPFアルゴリズム選択と呼ばれる新しいASメソッドが実現された。
論文参考訳（メタデータ） (2024-06-16T07:41:58Z)
HiMAP: Learning Heuristics-Informed Policies for Large-Scale Multi-Agent Pathfinding [16.36594480478895]
Heuristics-Informed Multi-Agent Pathfinding (HiMAP) Heuristics-Informed Multi-Agent Pathfinding (HiMAP)
論文参考訳（メタデータ） (2024-02-23T13:01:13Z)
Scalable Mechanism Design for Multi-Agent Path Finding [87.40027406028425]
MAPF (Multi-Agent Path Finding) は、複数のエージェントが同時に移動し、与えられた目標地点に向かって共有領域を通って衝突しない経路を決定する。最適解を見つけることは、しばしば計算不可能であり、近似的な準最適アルゴリズムを用いることが不可欠である。本稿では、MAPFのスケーラブルな機構設計の問題を紹介し、MAPFアルゴリズムを近似した3つの戦略防御機構を提案する。
論文参考訳（メタデータ） (2024-01-30T14:26:04Z)
Decentralized Monte Carlo Tree Search for Partially Observable Multi-agent Pathfinding [49.730902939565986]
マルチエージェントパスフィンディング問題は、グラフに閉じ込められたエージェントのグループに対するコンフリクトフリーパスのセットを見つけることである。本研究では、エージェントが他のエージェントをローカルにのみ観察できる分散MAPF設定に焦点を当てた。 MAPFタスクのための分散マルチエージェントモンテカルロ木探索法を提案する。
論文参考訳（メタデータ） (2023-12-26T06:57:22Z)
Traffic Flow Optimisation for Lifelong Multi-Agent Path Finding [29.76466191644455]
MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題であり、エージェントのチームに対して衝突のない経路の計算を求める。本稿では,MAPFにエージェントを誘導する手法を提案する。各エージェントが1つの宛先を持つワンショットMAPFと、エージェントが常に新しい宛先を割り当てる終身MAPFの2つの大規模設定でこのアイデアを評価する。
論文参考訳（メタデータ） (2023-08-22T07:17:39Z)
Learning Team-Based Navigation: A Review of Deep Reinforcement Learning Techniques for Multi-Agent Pathfinding [2.7898966850590625]
本稿では、MAPFにおけるDRLベースのアプローチの統合に焦点を当てる。我々は、MAPFソリューションの評価における現在のギャップを、統一的な評価指標の欠如に対処して埋めることを目的としている。本稿では,モデルベースDRLの将来的な方向性としての可能性について論じ,その基礎的理解を提供する。
論文参考訳（メタデータ） (2023-08-11T00:59:29Z)
Conflict-Based Search for Explainable Multi-Agent Path Finding [7.734726150561088]
安全クリティカルなアプリケーションでは、人間の監督者は、この計画が本当に衝突のないものであることを検証したいかもしれない。 MAPF問題は、簡潔な説明を認める非衝突経路のセットを要求する。従来のMAPFアルゴリズムは、説明可能なMAPFを直接処理するものではない。我々は、MAPFのためのよく研究されたアルゴリズムである Conflict Based Search (CBS) を適用して、説明可能なMAPFを扱う。
論文参考訳（メタデータ） (2022-02-20T23:13:14Z)
Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。コア最適化問題の実用的なパラメトリゼーションを提供する。
論文参考訳（メタデータ） (2021-07-08T18:01:02Z)
Memory-Based Optimization Methods for Model-Agnostic Meta-Learning and Personalized Federated Learning [56.17603785248675]
モデルに依存しないメタラーニング (MAML) が人気のある研究分野となっている。既存のMAMLアルゴリズムは、イテレーション毎にメタモデルを更新するためにいくつかのタスクとデータポイントをサンプリングすることで、エピソードのアイデアに依存している。本稿では,MAMLのメモリベースアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-06-09T08:47:58Z)
MALib: A Parallel Framework for Population-based Multi-agent Reinforcement Learning [61.28547338576706]
人口ベースマルチエージェント強化学習(PB-MARL)は、強化学習(RL)アルゴリズムでネストした一連の手法を指す。 PB-MARLのためのスケーラブルで効率的な計算フレームワークMALibを提案する。
論文参考訳（メタデータ） (2021-06-05T03:27:08Z)
Energy-Efficient and Federated Meta-Learning via Projected Stochastic Gradient Ascent [79.58680275615752]
エネルギー効率のよいメタラーニングフレームワークを提案する。各タスクは別々のエージェントによって所有されていると仮定するため、メタモデルをトレーニングするために限られたタスクが使用される。
論文参考訳（メタデータ） (2021-05-31T08:15:44Z)
Compilation-based Solvers for Multi-Agent Path Finding: a Survey, Discussion, and Future Opportunities [7.766921168069532]
このトピックの過去の発展と現在の傾向から学んだ教訓を示し、その広範な影響について議論します。最適MAPF解決のための2つの主要なアプローチは、(1)MAPFを直接解決する専用の検索ベース手法、(2)MAPFインスタンスを異なる確立された形式でインスタンスに還元するコンパイルベース手法である。
論文参考訳（メタデータ） (2021-04-23T20:13:12Z)
The Surprising Effectiveness of MAPPO in Cooperative, Multi-Agent Games [67.47961797770249]
マルチエージェントPPO(MAPPO)は、集中型値関数を採用するマルチエージェントPPOバリアントである。 MAPPOは,3つの一般的なマルチエージェントテストベッドにおいて,最先端技術に匹敵する性能を実現していることを示す。
論文参考訳（メタデータ） (2021-03-02T18:59:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。