論文の概要: Advancing Learnable Multi-Agent Pathfinding Solvers with Active Fine-Tuning
- arxiv url: http://arxiv.org/abs/2506.23793v1
- Date: Mon, 30 Jun 2025 12:34:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:54.053271
- Title: Advancing Learnable Multi-Agent Pathfinding Solvers with Active Fine-Tuning
- Title(参考訳): 能動ファインチューニングによる学習可能な多エージェントパスフィニングソルの開発
- Authors: Anton Andreychuk, Konstantin Yakovlev, Aleksandr Panov, Alexey Skrynnik,
- Abstract要約: マルチエージェントパスフィンディング(MAPF)は、マルチロボット軌道計画問題の共通の抽象化である。
本稿では,機械学習を活用した分散化サブ最適化MAPFソルバMAPF-GPT-DDGを紹介する。
本実験は,MAPF-GPT-DDGが既存の学習型MAPF解法を超えることを示した。
- 参考スコア(独自算出の注目度): 46.35418789518417
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent pathfinding (MAPF) is a common abstraction of multi-robot trajectory planning problems, where multiple homogeneous robots simultaneously move in the shared environment. While solving MAPF optimally has been proven to be NP-hard, scalable, and efficient, solvers are vital for real-world applications like logistics, search-and-rescue, etc. To this end, decentralized suboptimal MAPF solvers that leverage machine learning have come on stage. Building on the success of the recently introduced MAPF-GPT, a pure imitation learning solver, we introduce MAPF-GPT-DDG. This novel approach effectively fine-tunes the pre-trained MAPF model using centralized expert data. Leveraging a novel delta-data generation mechanism, MAPF-GPT-DDG accelerates training while significantly improving performance at test time. Our experiments demonstrate that MAPF-GPT-DDG surpasses all existing learning-based MAPF solvers, including the original MAPF-GPT, regarding solution quality across many testing scenarios. Remarkably, it can work with MAPF instances involving up to 1 million agents in a single environment, setting a new milestone for scalability in MAPF domains.
- Abstract(参考訳): マルチエージェントパスフィンディング(MAPF)は、複数の同種ロボットが同時に共有環境に移動するマルチロボット軌道計画問題の共通の抽象化である。
MAPFを最適に解くことはNPハードでスケーラブルで効率的であることが証明されているが、ロジスティクスや検索・救助といった現実世界のアプリケーションには不可欠である。
この目的のために、機械学習を活用した分散化された準最適MAPFソルバがステージに立った。
近年導入されたMAPF-GPT(擬似学習)の成功を踏まえ,MAPF-GPT-DDGを紹介する。
この新しいアプローチは、集中的な専門家データを用いて、事前訓練されたMAPFモデルを効果的に微調整する。
新しいデルタデータ生成機構を利用することで、MAPF-GPT-DDGはトレーニングを加速し、テスト時のパフォーマンスを大幅に改善する。
本実験により,MAPF-GPT-DDGは,従来のMAPF-GPTを含む既存の学習ベースMAPFソルバを超越し,多くのテストシナリオにおけるソリューション品質について検討した。
注目すべきは、単一の環境に最大100万のエージェントを含むMAPFインスタンスを扱うことができ、MAPFドメインにおけるスケーラビリティの新たなマイルストーンを設定できることだ。
関連論文リスト
- Enhancing Lifelong Multi-Agent Path-finding by Using Artificial Potential Fields [15.082298617948581]
MAPFアルゴリズムにAPFを組み込む手法を提案する。
APFはMAPFにとって有益ではないが、LMAPFのシステム全体のスループットは最大で7倍に向上する。
論文 参考訳(メタデータ) (2025-05-28T18:13:10Z) - Advancing MAPF towards the Real World: A Scalable Multi-Agent Realistic Testbed (SMART) [37.17845947950689]
Scalable Multi-Agent Realistic Testbed (smart)は、マルチエージェントパス探索(MAPF)アルゴリズムを評価するための、現実的で効率的なソフトウェアツールである。
我々は,実世界のシナリオにおけるMAPFアルゴリズムの実行に関する研究質問をSMARTを用いて探索し,実証する。
論文 参考訳(メタデータ) (2025-03-03T05:26:59Z) - Transient Multi-Agent Path Finding for Lifelong Navigation in Dense Environments [9.000023855628958]
ライフロングMAPF(英: Lifelong MAPF、LMAPF)は、エージェントが現在のターゲットに到達すると新たなターゲットを受信するMAPFのオンライン版である。
そこで本研究では,LMAPF問題に対して,各エージェントが最終的にターゲットを訪問することを目的とした修正MAPF問題の系列を解くことで,LMAPF問題を解くことを提案する。
本稿では、このMAPF変種をTransient MAPF (TMAPF) と呼び、既存のMAPFアルゴリズムに基づいたいくつかのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-05T15:37:29Z) - MAPF-GPT: Imitation Learning for Multi-Agent Pathfinding at Scale [46.35418789518417]
MAPF(Multi-agent pathfinding)は、一般に、共有環境において複数のエージェントに対して衝突のない経路を見つけることを必要とする問題である。
近年、MAPFへの学習に基づくアプローチが注目されており、特に深層強化学習を活用している。
MAPF-GPTは,多種多様な問題インスタンスにおいて,現在最も優れた学習可能なMAPFソルバよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-08-29T12:55:10Z) - Scalable Mechanism Design for Multi-Agent Path Finding [87.40027406028425]
MAPF (Multi-Agent Path Finding) は、複数のエージェントが同時に移動し、与えられた目標地点に向かって共有領域を通って衝突しない経路を決定する。
最適解を見つけることは、しばしば計算不可能であり、近似的な準最適アルゴリズムを用いることが不可欠である。
本稿では、MAPFのスケーラブルな機構設計の問題を紹介し、MAPFアルゴリズムを近似した3つの戦略防御機構を提案する。
論文 参考訳(メタデータ) (2024-01-30T14:26:04Z) - Decentralized Monte Carlo Tree Search for Partially Observable
Multi-agent Pathfinding [49.730902939565986]
マルチエージェントパスフィンディング問題は、グラフに閉じ込められたエージェントのグループに対するコンフリクトフリーパスのセットを見つけることである。
本研究では、エージェントが他のエージェントをローカルにのみ観察できる分散MAPF設定に焦点を当てた。
MAPFタスクのための分散マルチエージェントモンテカルロ木探索法を提案する。
論文 参考訳(メタデータ) (2023-12-26T06:57:22Z) - Multi-Agent Automated Machine Learning [54.14038920246645]
自動機械学習(AutoML)におけるモジュールの共同最適化のためのマルチエージェント自動機械学習(MA2ML)を提案する。
MA2MLはモジュール間の協力を強化するために各エージェントにクレジットを明示的に割り当て、検索効率を向上させるために政治外の学習を取り入れている。
実験により、MA2MLは計算コストの制約の下でImageNet上で最先端のトップ1の精度が得られることが示された。
論文 参考訳(メタデータ) (2022-10-17T13:32:59Z) - Memory-Based Optimization Methods for Model-Agnostic Meta-Learning and
Personalized Federated Learning [56.17603785248675]
モデルに依存しないメタラーニング (MAML) が人気のある研究分野となっている。
既存のMAMLアルゴリズムは、イテレーション毎にメタモデルを更新するためにいくつかのタスクとデータポイントをサンプリングすることで、エピソードのアイデアに依存している。
本稿では,MAMLのメモリベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-09T08:47:58Z) - Compilation-based Solvers for Multi-Agent Path Finding: a Survey,
Discussion, and Future Opportunities [7.766921168069532]
このトピックの過去の発展と現在の傾向から学んだ教訓を示し、その広範な影響について議論します。
最適MAPF解決のための2つの主要なアプローチは、(1)MAPFを直接解決する専用の検索ベース手法、(2)MAPFインスタンスを異なる確立された形式でインスタンスに還元するコンパイルベース手法である。
論文 参考訳(メタデータ) (2021-04-23T20:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。