論文の概要: A Multi-Agent Reinforcement Learning Approach for Cooperative Air-Ground-Human Crowdsensing in Emergency Rescue
- arxiv url: http://arxiv.org/abs/2505.06997v1
- Date: Sun, 11 May 2025 14:49:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.152718
- Title: A Multi-Agent Reinforcement Learning Approach for Cooperative Air-Ground-Human Crowdsensing in Emergency Rescue
- Title(参考訳): 救急救助における協調型空中ヒューマン群集のマルチエージェント強化学習手法
- Authors: Wenhao Lu, Zhengqiu Zhu, Yong Zhao, Yonglin Tian, Junjie Zeng, Jun Zhang, Zhong Liu, Fei-Yue Wang,
- Abstract要約: 本稿では,ヒト,UAV,UGVを考慮し,不均一な協調作業割当問題に対処する。
我々は,UGVが低電池UAVのチャージを優先し,検知タスクを遂行する,新しい「ハード・コラボレーティブ」政策を導入する。
本稿では,分散実行アーキテクチャに基づく新しいマルチエージェント強化学習アルゴリズムであるHECTA4ERを提案する。
- 参考スコア(独自算出の注目度): 22.201769922727077
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile crowdsensing is evolving beyond traditional human-centric models by integrating heterogeneous entities like unmanned aerial vehicles (UAVs) and unmanned ground vehicles (UGVs). Optimizing task allocation among these diverse agents is critical, particularly in challenging emergency rescue scenarios characterized by complex environments, limited communication, and partial observability. This paper tackles the Heterogeneous-Entity Collaborative-Sensing Task Allocation (HECTA) problem specifically for emergency rescue, considering humans, UAVs, and UGVs. We introduce a novel ``Hard-Cooperative'' policy where UGVs prioritize recharging low-battery UAVs, alongside performing their sensing tasks. The primary objective is maximizing the task completion rate (TCR) under strict time constraints. We rigorously formulate this NP-hard problem as a decentralized partially observable Markov decision process (Dec-POMDP) to effectively handle sequential decision-making under uncertainty. To solve this, we propose HECTA4ER, a novel multi-agent reinforcement learning algorithm built upon a Centralized Training with Decentralized Execution architecture. HECTA4ER incorporates tailored designs, including specialized modules for complex feature extraction, utilization of action-observation history via hidden states, and a mixing network integrating global and local information, specifically addressing the challenges of partial observability. Furthermore, theoretical analysis confirms the algorithm's convergence properties. Extensive simulations demonstrate that HECTA4ER significantly outperforms baseline algorithms, achieving an average 18.42% increase in TCR. Crucially, a real-world case study validates the algorithm's effectiveness and robustness in dynamic sensing scenarios, highlighting its strong potential for practical application in emergency response.
- Abstract(参考訳): モバイルのクラウドセンシングは、無人航空機(UAV)や無人地上車両(UGV)のような異質な実体を統合することで、従来の人間中心モデルを超えて進化している。
これらの多様なエージェント間のタスク割り当ての最適化は、特に複雑な環境、限られた通信、部分的な可観測性によって特徴づけられる、困難な緊急救助シナリオにおいて重要である。
本稿では,人,UAV,UGVを考慮し,緊急救助に特化して,異機種間協調作業割当(HECTA)問題に取り組む。
我々は,UGVが低電池UAVのチャージを優先し,検知タスクを遂行する,新しい「ハード・コラボレーティブ」政策を導入する。
主な目的は、厳密な時間制約の下でタスク完了率(TCR)を最大化することである。
我々は、このNPハード問題を分散部分観測可能マルコフ決定プロセス(Dec-POMDP)として厳格に定式化し、不確実性の下でシーケンシャルな意思決定を効果的に処理する。
そこで本研究では,分散実行アーキテクチャを用いた集中学習に基づく,新しいマルチエージェント強化学習アルゴリズムであるHECTA4ERを提案する。
HECTA4ERは、複雑な特徴抽出のための特別なモジュール、隠れ状態による行動観測履歴の利用、グローバルおよびローカル情報を統合した混合ネットワーク、特に部分観測可能性の課題に対処する。
さらに、理論解析によりアルゴリズムの収束特性が確認できる。
大規模なシミュレーションにより、HECTA4ERはベースラインアルゴリズムを著しく上回り、TCRの平均18.42%の増加を達成した。
現実のケーススタディでは、動的センシングシナリオにおけるアルゴリズムの有効性とロバスト性を検証し、緊急対応における実用的な応用の可能性を強調している。
関連論文リスト
- Aerial Secure Collaborative Communications under Eavesdropper Collusion in Low-altitude Economy: A Generative Swarm Intelligent Approach [84.20358039333756]
本研究では,AAV群に分散コラボレーティブビームフォーミング(DCB)を導入し,対応する信号分布を制御して盗聴者の共謀を処理した。
両方向の秘密保持能力と最大サイドローブレベルを最小化して、未知の盗聴者からの情報漏洩を回避する。
本稿では,より少ないオーバーヘッドで問題を解決するために,新しいジェネレーティブ・スウォーム・インテリジェンス(GenSI)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-02T04:02:58Z) - Generative AI-Enhanced Cooperative MEC of UAVs and Ground Stations for Unmanned Surface Vehicles [36.3157805511305]
無人地上機(USV)は低コストで柔軟な航空サービスを提供している。
地上局(GS)は、複雑なシナリオでUSVを支援するために協力する強力な支援を提供することができる。
本稿では,UAVとGSをベースとした堅牢なマルチアクセスエッジコンピューティングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-12T04:42:59Z) - MAGNNET: Multi-Agent Graph Neural Network-based Efficient Task Allocation for Autonomous Vehicles with Deep Reinforcement Learning [2.5022287664959446]
本稿では,グラフニューラルネットワーク(GNN)を一元的トレーニングと分散実行(CTDE)パラダイムに統合する新しいフレームワークを提案する。
本手法により,無人航空機 (UAV) と無人地上車両 (UGV) は, 中央調整を必要とせず, 効率よくタスクを割り当てることができる。
論文 参考訳(メタデータ) (2025-02-04T13:29:56Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Weighted strategies to guide a multi-objective evolutionary algorithm
for multi-UAV mission planning [12.97430155510359]
この研究は、新しい個体の生成と突然変異のための重み付きランダム・ジェネレータを提案する。
この研究の主な目的は、マルチUAVミッション計画のためのMOEAソルバの収束率を下げることである。
論文 参考訳(メタデータ) (2024-02-28T23:05:27Z) - Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。
モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。
本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文 参考訳(メタデータ) (2023-06-29T15:57:07Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - Dif-MAML: Decentralized Multi-Agent Meta-Learning [54.39661018886268]
我々は,MAML や Dif-MAML と呼ばれる協調型マルチエージェントメタ学習アルゴリズムを提案する。
提案手法により, エージェントの集合が線形速度で合意に達し, 集約MAMLの定常点に収束できることを示す。
シミュレーションの結果は従来の非協調的な環境と比較して理論的な結果と優れた性能を示している。
論文 参考訳(メタデータ) (2020-10-06T16:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。