論文の概要: STEAM: A Training-Free Congestion-Aware Enhancement Framework for Decentralized Multi-Agent Path Finding
- arxiv url: http://arxiv.org/abs/2605.20929v1
- Date: Wed, 20 May 2026 09:13:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.592992
- Title: STEAM: A Training-Free Congestion-Aware Enhancement Framework for Decentralized Multi-Agent Path Finding
- Title(参考訳): STEAM: 分散マルチエージェント経路探索のための学習不要な渋滞認識向上フレームワーク
- Authors: Mingyang Feng, Mengnuo Zhang, Shaoyuan Li, Xiang Yin,
- Abstract要約: 本稿では,学習型分散マルチエージェントパス探索(MAPF)のための学習自由度テスト時間拡張フレームワークを提案する。
STEAM(Spatial, Temporal, Emergent congestion Awareness for MAPF)は,オリジナルのポリシー実行に軽量な渋滞対応ガイダンスを注入する。
代表的学習に基づく分散MAPFアルゴリズムの実験により、STEAMは成功率、ムスパン、ソリューションコストを一貫して改善することが示された。
- 参考スコア(独自算出の注目度): 12.079264075688199
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose STEAM (Spatial, Temporal, and Emergent congestion Awareness for MAPF), a training-free test-time enhancement framework for learning-based decentralized Multi-Agent Path Finding (MAPF) in discrete environments. Given a pretrained decentralized policy, STEAM requires no retraining, architectural modification, or replacement by a centralized planner. Instead, it injects lightweight congestion-aware guidance into the original policy execution. STEAM first rolls out the shortest paths induced by the current cost-to-go maps to identify potential future congestion hotspots. Spatially avoidable congestion is mitigated by updating agent-specific cost-to-go information, while spatially unavoidable bottlenecks are handled through temporal logit correction. In addition, emergent local congestion is reduced by a density-aware logit correction based on neighboring agents' corrected cost-to-go maps. Extensive experiments on representative learning-based decentralized MAPF algorithms show that STEAM consistently improves success rate, makespan, and solution cost, with success-rate gains of up to 60% and only minor computational overhead. The implementation is available at https://anonymous.4open.science/r/STEAM-MAPF-7A62.
- Abstract(参考訳): STEAM(Spatial, Temporal, Emergent congestion Awareness for MAPF)は,学習型分散マルチエージェントパス探索(MAPF)のための学習不要なテスト時間拡張フレームワークである。
STEAMは事前訓練された分散型ポリシーを前提としており、再訓練やアーキテクチャの変更、集中型プランナーによる代替は必要としない。
代わりに、オリジナルのポリシー実行に軽量な渋滞対応ガイダンスを注入する。
STEAMはまず、現在のコスト・ツー・ゴーマップによって引き起こされる最も短い経路をロールアウトし、将来の混雑ホットスポットを特定する。
エージェント固有のコスト・ツー・ゴー情報を更新することで空間的に回避可能な混雑を軽減し、空間的に避けられないボトルネックを時間的ロジット補正によって処理する。
さらに、近隣エージェントの補正コスト・ツー・ゴーマップに基づく密度認識ロジット補正により、創発的局所混雑を低減させる。
代表的学習に基づく分散MAPFアルゴリズムの大規模な実験により、STEAMは成功率、メイスパン、ソリューションコストを継続的に改善し、成功率は60%まで向上し、計算オーバーヘッドはわずかである。
実装はhttps://anonymous.4open.science/r/STEAM-MAPF-7A62で公開されている。
関連論文リスト
- Regret Lower Bounds for Decentralized Multi-Agent Stochastic Shortest Path Problems [1.1575091540914677]
最短経路(SSP)問題は、このような設定で分散制御をモデル化するための自然なフレームワークを提供する。
線形関数近似による分散マルチエージェントSSP(Dec-MASSP)について検討する。
新たな対称性に基づく議論を応用し、最適政策の構造を同定する。
論文 参考訳(メタデータ) (2025-11-06T17:49:33Z) - Towards Communication-efficient Federated Learning via Sparse and Aligned Adaptive Optimization [90.08459757321405]
Federated Adam (FedAdam) アルゴリズムはアップリンク通信オーバーヘッドの3倍の増大に悩まされている。
我々はFedAdam-SSMと呼ばれる新しいスパースなFedAdamアルゴリズムを提案する。
我々は,FedAdam-SSMが訓練したモデルと集中型Adamの差異を最小化することにより,スペーシフィケーションエラーによる学習性能劣化を軽減するためにSSMを最適化する。
論文 参考訳(メタデータ) (2024-05-28T07:56:49Z) - Imitation Learning based Alternative Multi-Agent Proximal Policy
Optimization for Well-Formed Swarm-Oriented Pursuit Avoidance [15.498559530889839]
本稿では,分散学習に基づく代替的マルチエージェント・プロキシ・ポリシー最適化(IA-MAPPO)アルゴリズムを提案する。
擬似学習を利用して生成コントローラを分散化し,通信オーバーヘッドを低減し,スケーラビリティを向上させる。
シミュレーションの結果,IA-MAPPOの有効性が検証され,広範囲なアブレーション実験により,通信オーバーヘッドが著しく減少する集中型解に匹敵する性能が示された。
論文 参考訳(メタデータ) (2023-11-06T06:58:16Z) - Optimizing Crowd-Aware Multi-Agent Path Finding through Local Communication with Graph Neural Networks [15.88107215224685]
混在環境におけるマルチエージェントパス探索 (MAPF) は, 移動計画において困難な問題となる。
本稿では,この問題を解決するために,クラウド対応の分散強化学習手法であるCRAMPを紹介する。
CRAMPは, メースパンと衝突数で測定された溶液品質を最大59%改善し, 従来の方法と比較して最大35%改善した。
論文 参考訳(メタデータ) (2023-09-19T03:02:43Z) - MAPS: A Noise-Robust Progressive Learning Approach for Source-Free
Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。
本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文 参考訳(メタデータ) (2023-02-09T12:06:08Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z) - Coded Stochastic ADMM for Decentralized Consensus Optimization with Edge
Computing [113.52575069030192]
セキュリティ要件の高いアプリケーションを含むビッグデータは、モバイルデバイスやドローン、車両など、複数の異種デバイスに収集され、格納されることが多い。
通信コストとセキュリティ要件の制限のため、核融合センターにデータを集約するのではなく、分散的に情報を抽出することが最重要となる。
分散エッジノードを介してデータを局所的に処理するマルチエージェントシステムにおいて,モデルパラメータを学習する問題を考える。
分散学習モデルを開発するために,乗算器アルゴリズムの最小バッチ交互方向法(ADMM)のクラスについて検討した。
論文 参考訳(メタデータ) (2020-10-02T10:41:59Z) - Congestion-aware Evacuation Routing using Augmented Reality Devices [96.68280427555808]
複数の目的地間でリアルタイムに個別の避難経路を生成する屋内避難のための渋滞対応ルーティングソリューションを提案する。
建物内の混雑分布をモデル化するために、ユーザエンド拡張現実(AR)デバイスから避難者の位置を集約して、オンザフライで取得した人口密度マップを用いる。
論文 参考訳(メタデータ) (2020-04-25T22:54:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。