論文の概要: Responsive Regulation of Dynamic UAV Communication Networks Based on
Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2108.11012v1
- Date: Wed, 25 Aug 2021 02:04:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-26 12:52:28.852935
- Title: Responsive Regulation of Dynamic UAV Communication Networks Based on
Deep Reinforcement Learning
- Title(参考訳): 深層強化学習に基づく動的uav通信ネットワークの応答性制御
- Authors: Ran Zhang, Duc Minh (Aaron) Nguyen, Miao Wang, Lin X. Cai and Xuemin
(Sherman) Shen
- Abstract要約: 我々は、UAVラインアップの今後の変更を識別し、変更に先立ってUAVを移動できる最適なUAV制御ポリシーを開発する。
具体的には、時間軸の蓄積されたユーザ満足度(US)スコアを最大化するために、DRLに基づくUAV制御フレームワークを開発する。
さらに、連続状態と行動空間を扱うために、アクター批判に基づくDRLであるDeep Deterministic Policy gradient (DDPG)アルゴリズムを利用する。
- 参考スコア(独自算出の注目度): 16.78151396672782
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this chapter, the regulation of Unmanned Aerial Vehicle (UAV)
communication network is investigated in the presence of dynamic changes in the
UAV lineup and user distribution. We target an optimal UAV control policy which
is capable of identifying the upcoming change in the UAV lineup (quit or
join-in) or user distribution, and proactively relocating the UAVs ahead of the
change rather than passively dispatching the UAVs after the change.
Specifically, a deep reinforcement learning (DRL)-based UAV control framework
is developed to maximize the accumulated user satisfaction (US) score for a
given time horizon which is able to handle the change in both the UAV lineup
and user distribution. The framework accommodates the changed dimension of the
state-action space before and after the UAV lineup change by deliberate state
transition design. In addition, to handle the continuous state and action
space, deep deterministic policy gradient (DDPG) algorithm, which is an
actor-critic based DRL, is exploited. Furthermore, to promote the learning
exploration around the timing of the change, the original DDPG is adapted into
an asynchronous parallel computing (APC) structure which leads to a better
training performance in both the critic and actor networks. Finally, extensive
simulations are conducted to validate the convergence of the proposed learning
approach, and demonstrate its capability in jointly handling the dynamics in
UAV lineup and user distribution as well as its superiority over a passive
reaction method.
- Abstract(参考訳): 本章では,無人航空機(UAV)通信網の制御について,UAVラインアップとユーザ分布の動的変化の存在下で検討する。
我々は,UAVのラインアップ(クイットやジョイン)やユーザ分布の今後の変更を識別し,変更後のUAVを受動的にディスパッチするのではなく,変更前のUAVを積極的に移動させる,最適なUAV制御ポリシをターゲットにしている。
具体的には,高度強化学習(DRL)に基づくUAV制御フレームワークを開発し,UAVラインアップとユーザ分布の両方の変更を処理可能な,所定の時間地平線に対する蓄積されたユーザ満足度(US)スコアを最大化する。
このフレームワークは、意図的な状態遷移設計によりUAVラインアップ変更前後の状態-作用空間の変化次元に対応している。
さらに、連続状態と行動空間を扱うために、アクター批判に基づくDRLであるDeep Deterministic Policy gradient (DDPG)アルゴリズムを利用する。
さらに、変更のタイミングに関する学習探索を促進するため、オリジナルのDDPGは非同期並列コンピューティング(APC)構造に適合し、批評家ネットワークとアクターネットワークの双方でのトレーニング性能が向上する。
最後に,提案手法の収束性を検証し,UAVラインアップとユーザ分布のダイナミックスを協調的に扱う能力と,受動的反応法よりも優れた性能を示すため,広範囲なシミュレーションを行った。
関連論文リスト
- Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.33447711072726]
本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文 参考訳(メタデータ) (2024-11-05T10:45:30Z) - Cooperative Cognitive Dynamic System in UAV Swarms: Reconfigurable Mechanism and Framework [80.39138462246034]
UAVスワムの管理を最適化するための協調認知力学システム(CCDS)を提案する。
CCDSは階層的かつ協調的な制御構造であり、リアルタイムのデータ処理と意思決定を可能にする。
さらに、CCDSは、UAVスワムのタスクを効率的に割り当てるための生体模倣機構と統合することができる。
論文 参考訳(メタデータ) (2024-05-18T12:45:00Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z) - Multi-Agent Reinforcement Learning for Offloading Cellular Communications with Cooperating UAVs [21.195346908715972]
無人航空機は、地上のBSからデータトラフィックをオフロードする代替手段を提供する。
本稿では,地上BSからデータオフロードを行うために,複数のUAVを効率的に利用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-02-05T12:36:08Z) - Optimization for Master-UAV-powered Auxiliary-Aerial-IRS-assisted IoT
Networks: An Option-based Multi-agent Hierarchical Deep Reinforcement
Learning Approach [56.84948632954274]
本稿では,無人航空機(MUAV)搭載のIoT(Internet of Things)ネットワークについて検討する。
本稿では、インテリジェント反射面(IRS)を備えた充電可能な補助UAV(AUAV)を用いて、MUAVからの通信信号を強化することを提案する。
提案モデルでは,IoTネットワークの蓄積スループットを最大化するために,これらのエネルギー制限されたUAVの最適協調戦略について検討する。
論文 参考訳(メタデータ) (2021-12-20T15:45:28Z) - Federated Learning for UAV Swarms Under Class Imbalance and Power
Consumption Constraints [6.995852507959362]
設計上の制約を考慮しつつ、UAVの利用効率を調査することが不可欠である。
本稿では,各UAVが機械学習分類タスクを遂行する際のUAVスワムの展開について検討する。
論文 参考訳(メタデータ) (2021-08-23T16:10:14Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - SREC: Proactive Self-Remedy of Energy-Constrained UAV-Based Networks via
Deep Reinforcement Learning [11.065500588538997]
複数の無人航空機(UAV)のエネルギーを意識した制御は、UAVベースのネットワークにおける主要な研究の1つである。
1つ以上のUAVがエネルギー不足であり、充電を中止しようとしている場合、エネルギー制約されたUAVネットワークの積極的な自己修復について検討する。
我々は,UAVがネットワークを離脱しようとしている場合に,UAVを積極的に移動させる,エネルギーを意識した最適なUAV制御ポリシーを提案する。
論文 参考訳(メタデータ) (2020-09-17T20:51:17Z) - UAV Path Planning for Wireless Data Harvesting: A Deep Reinforcement
Learning Approach [18.266087952180733]
本稿では,IoT(Internet of Things)デバイスからのUAV対応データ収集に対するエンドツーエンド強化学習手法を提案する。
自律ドローンは、限られた飛行時間と障害物回避を受ける分散センサーノードからデータを収集する。
提案するネットワークアーキテクチャにより,エージェントが様々なシナリオパラメータの移動決定を行うことができることを示す。
論文 参考訳(メタデータ) (2020-07-01T15:14:16Z) - Autonomous UAV Navigation: A DDPG-based Deep Reinforcement Learning
Approach [1.552282932199974]
深層強化学習を用いた自律型UAV経路計画フレームワークを提案する。
目的は、自力で訓練されたUAVを空飛ぶ移動体ユニットとして使用し、空間的に分散した移動または静的な目標に到達することである。
論文 参考訳(メタデータ) (2020-03-21T19:33:00Z) - Federated Learning in the Sky: Joint Power Allocation and Scheduling
with UAV Swarms [98.78553146823829]
無人航空機(UAV)は様々なタスクを実行するために機械学習(ML)を利用する必要がある。
本稿では,UAVスワム内に分散学習(FL)アルゴリズムを実装するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T14:04:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。