論文の概要: Multi-Agent Reinforcement Learning in NOMA-aided UAV Networks for
Cellular Offloading
- arxiv url: http://arxiv.org/abs/2010.09094v1
- Date: Sun, 18 Oct 2020 20:22:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 04:23:24.388114
- Title: Multi-Agent Reinforcement Learning in NOMA-aided UAV Networks for
Cellular Offloading
- Title(参考訳): セルオフロードのためのNOMA支援UAVネットワークにおけるマルチエージェント強化学習
- Authors: Ruikang Zhong, Xiao Liu, Yuanwei Liu and Yue Chen
- Abstract要約: 複数の無人航空機(UAV)によるセルローディングのための新しい枠組みの提案
非直交多重アクセス(NOMA)技術は、無線ネットワークのスペクトル効率をさらに向上するために、各UAVに採用されている。
相互深いQ-network (MDQN) アルゴリズムは,UAVの最適3次元軌道と電力配分を共同で決定するために提案される。
- 参考スコア(独自算出の注目度): 59.32570888309133
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A novel framework is proposed for cellular offloading with the aid of
multiple unmanned aerial vehicles (UAVs), while the non-orthogonal multiple
access (NOMA) technique is employed at each UAV to further improve the spectrum
efficiency of the wireless network. The optimization problem of joint
three-dimensional (3D) trajectory design and power allocation is formulated for
maximizing the throughput. Since ground mobile users are considered as roaming
continuously, the UAVs need to be re-deployed timely based on the movement of
users. In an effort to solve this pertinent dynamic problem, a K-means based
clustering algorithm is first adopted for periodically partitioning users.
Afterward, a mutual deep Q-network (MDQN) algorithm is proposed to jointly
determine the optimal 3D trajectory and power allocation of UAVs. In contrast
to the conventional DQN algorithm, the MDQN algorithm enables the experience of
multi-agent to be input into a shared neural network to shorten the training
time with the assistance of state abstraction. Numerical results demonstrate
that: 1) the proposed MDQN algorithm is capable of converging under minor
constraints and has a faster convergence rate than the conventional DQN
algorithm in the multi-agent case; 2) The achievable sum rate of the NOMA
enhanced UAV network is 23% superior to the case of orthogonal multiple access
(OMA); 3) By designing the optimal 3D trajectory of UAVs with the aid of the
MDON algorithm, the sum rate of the network enjoys 142% and 56% gains than that
of invoking the circular trajectory and the 2D trajectory, respectively.
- Abstract(参考訳): 複数の無人航空機(UAV)によるセルローディングのための新しい枠組みが提案され、無線ネットワークのスペクトル効率をさらに向上するために、非直交多重アクセス(NOMA)技術が各UAVに採用されている。
スループットを最大化するための3次元3次元軌道設計と電力配分の最適化問題を定式化する。
地上のモバイルユーザーは連続的にローミングされるので、uavはユーザーの移動に基づいてタイムリーに再配置する必要がある。
この関連する動的問題を解決するために、K平均クラスタリングアルゴリズムが最初に採用され、定期的にユーザを分割する。
その後、UAVの最適3次元軌道と電力配分を共同で決定するために、相互深度Q-network(MDQN)アルゴリズムを提案する。
従来のDQNアルゴリズムとは対照的に、MDQNアルゴリズムは、マルチエージェントの経験を共有ニューラルネットワークに入力し、状態抽象化の助けを借りてトレーニング時間を短縮することを可能にする。
数値的な結果は、
1) 提案するmdqnアルゴリズムは,小制約下で収束することができ,マルチエージェントの場合,従来のdqnアルゴリズムよりも収束速度が速い。
2) 直交多重アクセス (OMA) の場合よりも, NOMA 拡張 UAV ネットワークの達成可能な総和率は 23% である。
3) MDONアルゴリズムを用いてUAVの最適3次元軌道を設計することにより, ネットワークの総和率は, 円軌道と2次元軌道をそれぞれ呼び出す場合よりも142%, 56%向上する。
関連論文リスト
- Joint User Association, Interference Cancellation and Power Control for
Multi-IRS Assisted UAV Communications [80.35959154762381]
インテリジェント反射面(IRS)支援無人航空機(UAV)通信は、地上基地局の負荷を低コストで軽減することが期待されている。
既存の研究は主に、複数のIRSではなく単一のIRSの配置とリソース割り当てに焦点を当てている。
我々は,共同IRSユーザアソシエーションのための新しい最適化アルゴリズム,UAVの軌道最適化,逐次干渉キャンセル(SIC)復号命令スケジューリング,電力割り当てを提案する。
論文 参考訳(メタデータ) (2023-12-08T01:57:10Z) - Multi-Agent Reinforcement Learning with Action Masking for UAV-enabled
Mobile Communications [1.3053649021965603]
無人航空機(UAV)は、アドホックな通信インフラを提供するために、航空基地局としてますます使われている。
本稿では,地上通信インフラのないモバイルユーザに対して,複数のUAVを無線通信に利用することに焦点を当てる。
システムスループットを最大化するために,UAV 3DトラジェクトリとNOMAパワーアロケーションを共同で最適化する。
論文 参考訳(メタデータ) (2023-03-29T14:41:03Z) - Optimization for Master-UAV-powered Auxiliary-Aerial-IRS-assisted IoT
Networks: An Option-based Multi-agent Hierarchical Deep Reinforcement
Learning Approach [56.84948632954274]
本稿では,無人航空機(MUAV)搭載のIoT(Internet of Things)ネットワークについて検討する。
本稿では、インテリジェント反射面(IRS)を備えた充電可能な補助UAV(AUAV)を用いて、MUAVからの通信信号を強化することを提案する。
提案モデルでは,IoTネットワークの蓄積スループットを最大化するために,これらのエネルギー制限されたUAVの最適協調戦略について検討する。
論文 参考訳(メタデータ) (2021-12-20T15:45:28Z) - Trajectory Design for UAV-Based Internet-of-Things Data Collection: A
Deep Reinforcement Learning Approach [93.67588414950656]
本稿では,無人航空機(UAV)による3D環境におけるIoT(Internet-of-Things)システムについて検討する。
本稿では,TD3-TDCTMアルゴリズムの完成時間最小化のためのトラジェクトリ設計を提案する。
シミュレーションの結果,従来の3つの非学習ベースライン法よりもTD3-TDCTMアルゴリズムの方が優れていることが示された。
論文 参考訳(メタデータ) (2021-07-23T03:33:29Z) - Jamming-Resilient Path Planning for Multiple UAVs via Deep Reinforcement
Learning [1.2330326247154968]
無人航空機(UAV)は無線ネットワークの不可欠な部分であると期待されている。
本論文では,複数のセルコネクテッドUAVの衝突のない経路を探索する。
本稿では,オンライン信号対干渉+雑音比マッピングを用いたオフライン時間差学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-04-09T16:52:33Z) - NOMA in UAV-aided cellular offloading: A machine learning approach [59.32570888309133]
複数の無人航空機(UAV)によるセルローディングのための新しい枠組みの提案
非直交多重アクセス(NOMA)技術は、無線ネットワークのスペクトル効率をさらに向上するために、各UAVに採用されている。
相互深いQ-network (MDQN) アルゴリズムは,UAVの最適3次元軌道と電力配分を共同で決定するために提案される。
論文 参考訳(メタデータ) (2020-10-18T17:38:48Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Machine Learning for Predictive Deployment of UAVs with Multiple Access [37.49465317156625]
本稿では無人航空機(UAV)の機械学習展開フレームワークについて検討する。
時間的なトラフィック分布のため、将来的なセルトラフィックを予測するために、LSTM(Long Short-term memory)ベースの予測が導入される。
提案手法は従来手法と比較して消費電力の最大24%を削減できる。
論文 参考訳(メタデータ) (2020-03-02T00:15:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。