論文の概要: DNN Task Assignment in UAV Networks: A Generative AI Enhanced Multi-Agent Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2411.08299v2
- Date: Mon, 09 Dec 2024 12:12:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:49:34.352131
- Title: DNN Task Assignment in UAV Networks: A Generative AI Enhanced Multi-Agent Reinforcement Learning Approach
- Title(参考訳): UAVネットワークにおけるDNNタスク割り当て:マルチエージェント強化学習アプローチの汎用AI
- Authors: Xin Tang, Qian Chen, Wenjie Weng, Binhan Liao, Jiacheng Wang, Xianbin Cao, Xiaohuan Li,
- Abstract要約: 本稿では,マルチエージェント強化学習(MARL)と生成拡散モデル(GDM)を組み合わせた共同手法を提案する。
第2段階では,GDMのリバース・デノナイズ・プロセスを利用して,マルチエージェント・ディープ・Deep Deterministic Policy gradient(MADDPG)におけるアクタネットワークを置き換える新しいDNNタスク割当アルゴリズム(GDM-MADDPG)を導入する。
シミュレーションの結果,提案アルゴリズムは,経路計画,情報化時代(AoI),エネルギー消費,タスク負荷分散の観点から,ベンチマークに比較して良好な性能を示した。
- 参考スコア(独自算出の注目度): 16.139481340656552
- License:
- Abstract: Unmanned Aerial Vehicles (UAVs) possess high mobility and flexible deployment capabilities, prompting the development of UAVs for various application scenarios within the Internet of Things (IoT). The unique capabilities of UAVs give rise to increasingly critical and complex tasks in uncertain and potentially harsh environments. The substantial amount of data generated from these applications necessitates processing and analysis through deep neural networks (DNNs). However, UAVs encounter challenges due to their limited computing resources when managing DNN models. This paper presents a joint approach that combines multiple-agent reinforcement learning (MARL) and generative diffusion models (GDM) for assigning DNN tasks to a UAV swarm, aimed at reducing latency from task capture to result output. To address these challenges, we first consider the task size of the target area to be inspected and the shortest flying path as optimization constraints, employing a greedy algorithm to resolve the subproblem with a focus on minimizing the UAV's flying path and the overall system cost. In the second stage, we introduce a novel DNN task assignment algorithm, termed GDM-MADDPG, which utilizes the reverse denoising process of GDM to replace the actor network in multi-agent deep deterministic policy gradient (MADDPG). This approach generates specific DNN task assignment actions based on agents' observations in a dynamic environment. Simulation results indicate that our algorithm performs favorably compared to benchmarks in terms of path planning, Age of Information (AoI), energy consumption, and task load balancing.
- Abstract(参考訳): Unmanned Aerial Vehicles (UAV) はモビリティとフレキシブルなデプロイメント機能を備えており、IoT(Internet of Things)内のさまざまなアプリケーションシナリオのための UAV の開発を促進する。
UAVのユニークな能力は、不確実で潜在的に厳しい環境において、ますます重要で複雑なタスクを引き起こす。
これらのアプリケーションから生成された大量のデータは、ディープニューラルネットワーク(DNN)による処理と分析を必要とする。
しかし、UAVはDNNモデルを管理する際の計算資源が限られているため、課題に直面している。
本稿では,マルチエージェント強化学習(MARL)とジェネレーティブ拡散モデル(GDM)を組み合わせて,タスクキャプチャから結果出力へのレイテンシ低減を目的としたUAVスワムにDNNタスクを割り当てる手法を提案する。
これらの課題に対処するために、まず、対象領域のタスクサイズと最短飛行経路を最適化の制約として考慮し、UAVの飛行経路とシステム全体のコストの最小化に焦点をあてて、サブプロブレムの解消にグリーディアルゴリズムを用いる。
第2段階では,GDMのリバース・デノナイズ・プロセスを利用して,マルチエージェント・ディープ・Deep Deterministic Policy gradient (MADDPG) におけるアクタネットワークを置き換える新しいDNNタスク割り当てアルゴリズム,GDM-MADDPGを導入する。
このアプローチは、動的環境におけるエージェントの観察に基づいて、特定のDNNタスク割り当てアクションを生成する。
シミュレーションの結果,提案アルゴリズムは,経路計画,情報化時代(AoI),エネルギー消費,タスク負荷分散の観点から,ベンチマークに比較して良好な性能を示した。
関連論文リスト
- Task Delay and Energy Consumption Minimization for Low-altitude MEC via Evolutionary Multi-objective Deep Reinforcement Learning [52.64813150003228]
無人航空機や他の航空機による低高度経済(LAE)は、輸送、農業、環境監視といった分野に革命をもたらした。
今後の6世代(6G)時代において、UAV支援移動エッジコンピューティング(MEC)は特に山岳や災害に遭った地域のような困難な環境において重要である。
タスクオフロード問題は、主にタスク遅延の最小化とUAVのエネルギー消費のトレードオフに対処するUAV支援MECの重要な問題の一つである。
論文 参考訳(メタデータ) (2025-01-11T02:32:42Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - GNN-Empowered Effective Partial Observation MARL Method for AoI Management in Multi-UAV Network [14.857267338331708]
本稿では,グラフニューラルネットワーク(GNN)とQMIXアルゴリズムを組み合わせたQedgixフレームワークを提案する。
シミュレーションの結果,提案アルゴリズムはユーザの平均AoI値を低減しつつ,コンバージェンス速度を大幅に改善することを示した。
論文 参考訳(メタデータ) (2024-08-18T02:29:10Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - Multi-Objective Optimization for UAV Swarm-Assisted IoT with Virtual
Antenna Arrays [55.736718475856726]
無人航空機(UAV)ネットワークはIoT(Internet-of-Things)を支援するための有望な技術である
既存のUAV支援データ収集および普及スキームでは、UAVはIoTとアクセスポイントの間を頻繁に飛行する必要がある。
協調ビームフォーミングをIoTとUAVに同時に導入し、エネルギーと時間効率のデータ収集と普及を実現した。
論文 参考訳(メタデータ) (2023-08-03T02:49:50Z) - AI-based Radio and Computing Resource Allocation and Path Planning in
NOMA NTNs: AoI Minimization under CSI Uncertainty [23.29963717212139]
高高度プラットフォーム(HAP)と無人航空機(UAV)からなる階層型空中コンピューティングフレームワークを開発する。
タスクスケジューリングは平均AoIを大幅に削減する。
電力割り当ては全ユーザに対して全送信電力を使用する場合と比較して平均AoIに限界効果があることが示されている。
論文 参考訳(メタデータ) (2023-05-01T11:52:15Z) - Computation Offloading and Resource Allocation in F-RANs: A Federated
Deep Reinforcement Learning Approach [67.06539298956854]
フォグ無線アクセスネットワーク(フォグ無線アクセスネットワーク、F-RAN)は、ユーザのモバイルデバイス(MD)が計算タスクを近くのフォグアクセスポイント(F-AP)にオフロードできる有望な技術である。
論文 参考訳(メタデータ) (2022-06-13T02:19:20Z) - Efficient Real-Time Image Recognition Using Collaborative Swarm of UAVs
and Convolutional Networks [9.449650062296824]
本稿では,画像の分類を行うリソース制約付きUAV群に推論要求を分散する戦略を提案する。
画像の取得と最終的な決定の待ち時間を最小限に抑える最適化問題としてモデルを定式化する。
私たちは、利用可能なUAV間で最高のレイテンシを提供するレイヤ配置戦略を見つけるために、オンラインソリューション、すなわちDistInferenceを導入します。
論文 参考訳(メタデータ) (2021-07-09T19:47:02Z) - Jamming-Resilient Path Planning for Multiple UAVs via Deep Reinforcement
Learning [1.2330326247154968]
無人航空機(UAV)は無線ネットワークの不可欠な部分であると期待されている。
本論文では,複数のセルコネクテッドUAVの衝突のない経路を探索する。
本稿では,オンライン信号対干渉+雑音比マッピングを用いたオフライン時間差学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-04-09T16:52:33Z) - Multi-Agent Reinforcement Learning in NOMA-aided UAV Networks for
Cellular Offloading [59.32570888309133]
複数の無人航空機(UAV)によるセルローディングのための新しい枠組みの提案
非直交多重アクセス(NOMA)技術は、無線ネットワークのスペクトル効率をさらに向上するために、各UAVに採用されている。
相互深いQ-network (MDQN) アルゴリズムは,UAVの最適3次元軌道と電力配分を共同で決定するために提案される。
論文 参考訳(メタデータ) (2020-10-18T20:22:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。