論文の概要: Task Assignment and Exploration Optimization for Low Altitude UAV Rescue via Generative AI Enhanced Multi-agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2504.13554v1
- Date: Fri, 18 Apr 2025 08:44:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 16:36:53.21139
- Title: Task Assignment and Exploration Optimization for Low Altitude UAV Rescue via Generative AI Enhanced Multi-agent Reinforcement Learning
- Title(参考訳): 汎用AIによるマルチエージェント強化学習による低高度UAV救助のためのタスク割り当てと探索最適化
- Authors: Xin Tang, Qian Chen, Wenjie Weng, Chao Jin, Zhang Liu, Jiacheng Wang, Geng Sun, Xiaohuan Li, Dusit Niyato,
- Abstract要約: UAVにおけるタスク割り当てと探索最適化の多目的最適化問題を定式化する。
我々の目標は、時間とともにシステムの安定性を確保しつつ、タスク完了時間とエネルギー消費を最小限にすることである。
本稿では,HG-MADDPGというアルゴリズムを提案する。このアルゴリズムは,ハンガリーのアルゴリズムと生成拡散モデル(GDM)に基づくマルチエージェント・ディープ決定性ポリシー勾配(MADDPG)アプローチを組み合わせたものである。
- 参考スコア(独自算出の注目度): 44.02103029265148
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial Intelligence (AI)-driven convolutional neural networks enhance rescue, inspection, and surveillance tasks performed by low-altitude uncrewed aerial vehicles (UAVs) and ground computing nodes (GCNs) in unknown environments. However, their high computational demands often exceed a single UAV's capacity, leading to system instability, further exacerbated by the limited and dynamic resources of GCNs. To address these challenges, this paper proposes a novel cooperation framework involving UAVs, ground-embedded robots (GERs), and high-altitude platforms (HAPs), which enable resource pooling through UAV-to-GER (U2G) and UAV-to-HAP (U2H) communications to provide computing services for UAV offloaded tasks. Specifically, we formulate the multi-objective optimization problem of task assignment and exploration optimization in UAVs as a dynamic long-term optimization problem. Our objective is to minimize task completion time and energy consumption while ensuring system stability over time. To achieve this, we first employ the Lyapunov optimization technique to transform the original problem, with stability constraints, into a per-slot deterministic problem. We then propose an algorithm named HG-MADDPG, which combines the Hungarian algorithm with a generative diffusion model (GDM)-based multi-agent deep deterministic policy gradient (MADDPG) approach. We first introduce the Hungarian algorithm as a method for exploration area selection, enhancing UAV efficiency in interacting with the environment. We then innovatively integrate the GDM and multi-agent deep deterministic policy gradient (MADDPG) to optimize task assignment decisions, such as task offloading and resource allocation. Simulation results demonstrate the effectiveness of the proposed approach, with significant improvements in task offloading efficiency, latency reduction, and system stability compared to baseline methods.
- Abstract(参考訳): 人工知能(AI)駆動の畳み込みニューラルネットワークは、未知の環境で低高度無人航空機(UAV)と地上コンピューティングノード(GCN)によって実行される救助、検査、監視タスクを強化する。
しかし、その高い計算要求は単一のUAVの容量を超えることが多く、システムの不安定性を引き起こし、GCNの制限された動的リソースによってさらに悪化する。
そこで本研究では,UAV-to-GER (U2G) とUAV-to-HAP (U2H) 通信による資源プールを実現するための,UAV,GER,高高度プラットフォーム(HAP)を含む新しい協調フレームワークを提案する。
具体的には,UAVにおけるタスク割り当てと探索最適化の多目的最適化問題を,動的長期最適化問題として定式化する。
我々の目標は、時間とともにシステムの安定性を確保しつつ、タスク完了時間とエネルギー消費を最小限にすることである。
これを実現するために、我々はまずLyapunov最適化手法を用いて、元の問題を安定性の制約で、スロットごとの決定論的問題に変換する。
次に,HG-MADDPGというアルゴリズムを提案する。このアルゴリズムは,ハンガリーのアルゴリズムと生成拡散モデル(GDM)に基づくマルチエージェント・ディープ決定性ポリシー勾配(MADDPG)アプローチを組み合わせたものである。
まず,地域選定手法としてハンガリーのアルゴリズムを導入し,環境との相互作用においてUAV効率を向上させる。
タスクオフロードやリソースアロケーションといったタスク割り当て決定を最適化するために,GDMとマルチエージェントのDeep Deterministic Policy gradient (MADDPG)を革新的に統合する。
シミュレーションの結果,提案手法の有効性が示され,タスクオフロード効率,遅延低減,システムの安定性がベースライン法に比べて大幅に向上した。
関連論文リスト
- Aerial Secure Collaborative Communications under Eavesdropper Collusion in Low-altitude Economy: A Generative Swarm Intelligent Approach [84.20358039333756]
本研究では,AAV群に分散コラボレーティブビームフォーミング(DCB)を導入し,対応する信号分布を制御して盗聴者の共謀を処理した。
両方向の秘密保持能力と最大サイドローブレベルを最小化して、未知の盗聴者からの情報漏洩を回避する。
本稿では,より少ないオーバーヘッドで問題を解決するために,新しいジェネレーティブ・スウォーム・インテリジェンス(GenSI)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-02T04:02:58Z) - Generative AI-Enhanced Cooperative MEC of UAVs and Ground Stations for Unmanned Surface Vehicles [36.3157805511305]
無人地上機(USV)は低コストで柔軟な航空サービスを提供している。
地上局(GS)は、複雑なシナリオでUSVを支援するために協力する強力な支援を提供することができる。
本稿では,UAVとGSをベースとした堅牢なマルチアクセスエッジコンピューティングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-12T04:42:59Z) - Task Delay and Energy Consumption Minimization for Low-altitude MEC via Evolutionary Multi-objective Deep Reinforcement Learning [52.64813150003228]
無人航空機や他の航空機による低高度経済(LAE)は、輸送、農業、環境監視といった分野に革命をもたらした。
今後の6世代(6G)時代において、UAV支援移動エッジコンピューティング(MEC)は特に山岳や災害に遭った地域のような困難な環境において重要である。
タスクオフロード問題は、主にタスク遅延の最小化とUAVのエネルギー消費のトレードオフに対処するUAV支援MECの重要な問題の一つである。
論文 参考訳(メタデータ) (2025-01-11T02:32:42Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - DNN Task Assignment in UAV Networks: A Generative AI Enhanced Multi-Agent Reinforcement Learning Approach [16.139481340656552]
本稿では,マルチエージェント強化学習(MARL)と生成拡散モデル(GDM)を組み合わせた共同手法を提案する。
第2段階では,GDMのリバース・デノナイズ・プロセスを利用して,マルチエージェント・ディープ・Deep Deterministic Policy gradient(MADDPG)におけるアクタネットワークを置き換える新しいDNNタスク割当アルゴリズム(GDM-MADDPG)を導入する。
シミュレーションの結果,提案アルゴリズムは,経路計画,情報化時代(AoI),エネルギー消費,タスク負荷分散の観点から,ベンチマークに比較して良好な性能を示した。
論文 参考訳(メタデータ) (2024-11-13T02:41:02Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - Research on an Autonomous UAV Search and Rescue System Based on the Improved [1.3399503792039942]
本稿では,EGO-Plannerアルゴリズムに基づく自律検索・救助UAVシステムを提案する。
逆モータバックステッピングの手法を用いて、UAVの全体的な飛行効率を高め、マシン全体の小型化を図る。
同時に、双方向A*アルゴリズムとオブジェクト検出アルゴリズムによって最適化されたEGO-Planner計画ツールも導入した。
論文 参考訳(メタデータ) (2024-06-01T17:25:29Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。