論文の概要: Deep Reinforcement Learning Based Multidimensional Resource Management
for Energy Harvesting Cognitive NOMA Communications
- arxiv url: http://arxiv.org/abs/2109.09503v1
- Date: Fri, 17 Sep 2021 08:55:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-21 15:57:49.675039
- Title: Deep Reinforcement Learning Based Multidimensional Resource Management
for Energy Harvesting Cognitive NOMA Communications
- Title(参考訳): 深層強化学習に基づく省エネルギー認知NOMA通信のための多次元資源管理
- Authors: Zhaoyuan Shi, Xianzhong Xie, Huabing Lu, Helin Yang, Jun Cai, and
Zhiguo Ding
- Abstract要約: エネルギー収穫(EH)、認知無線(CR)、非直交多重アクセス(NOMA)の組み合わせはエネルギー効率を向上させるための有望な解決策である。
本稿では,決定論的CR-NOMA IoTシステムにおけるスペクトル,エネルギー,時間資源管理について検討する。
- 参考スコア(独自算出の注目度): 64.1076645382049
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The combination of energy harvesting (EH), cognitive radio (CR), and
non-orthogonal multiple access (NOMA) is a promising solution to improve energy
efficiency and spectral efficiency of the upcoming beyond fifth generation
network (B5G), especially for support the wireless sensor communications in
Internet of things (IoT) system. However, how to realize intelligent frequency,
time, and energy resource allocation to support better performances is an
important problem to be solved. In this paper, we study joint spectrum, energy,
and time resource management for the EH-CR-NOMA IoT systems. Our goal is to
minimize the number of data packets losses for all secondary sensing users
(SSU), while satisfying the constraints on the maximum charging battery
capacity, maximum transmitting power, maximum buffer capacity, and minimum data
rate of primary users (PU) and SSUs. Due to the non-convexity of this
optimization problem and the stochastic nature of the wireless environment, we
propose a distributed multidimensional resource management algorithm based on
deep reinforcement learning (DRL). Considering the continuity of the resources
to be managed, the deep deterministic policy gradient (DDPG) algorithm is
adopted, based on which each agent (SSU) can manage its own multidimensional
resources without collaboration. In addition, a simplified but practical action
adjuster (AA) is introduced for improving the training efficiency and battery
performance protection. The provided results show that the convergence speed of
the proposed algorithm is about 4 times faster than that of DDPG, and the
average number of packet losses (ANPL) is about 8 times lower than that of the
greedy algorithm.
- Abstract(参考訳): エネルギー収穫(EH)、認知無線(CR)、非直交多重アクセス(NOMA)の組み合わせは、今後の第5世代ネットワーク(B5G)のエネルギー効率とスペクトル効率を改善するための有望なソリューションであり、特にIoT(Internet of Things)システムにおける無線センサ通信をサポートする。
しかし、より優れた性能を実現するために、インテリジェントな周波数、時間、エネルギー資源割り当てを実現する方法は、解決すべき重要な問題である。
本稿では,EH-CR-NOMA IoTシステムにおけるジョイントスペクトル,エネルギー,時間資源管理について検討する。
我々の目標は、プライマリユーザ(PU)とSSUの最大充電バッテリ容量、最大送電容量、最大バッファ容量、最小データレートの制約を満たすとともに、すべてのセカンダリセンサユーザ(SSU)のデータパケット損失の最小化である。
この最適化問題の非凸性と無線環境の確率的性質から,深部強化学習(DRL)に基づく分散多次元資源管理アルゴリズムを提案する。
管理対象資源の連続性を考慮すると、各エージェント(SSU)が協調せずに自身の多次元資源を管理することができるディープ決定性ポリシー勾配(DDPG)アルゴリズムを採用する。
さらに、訓練効率と電池性能の保護を改善するため、簡易だが実用的な動作調整器(AA)を導入している。
その結果,提案アルゴリズムの収束速度はDDPGの約4倍であり,パケット損失の平均値(ANPL)はgreedyアルゴリズムの約8倍であることがわかった。
関連論文リスト
- User Assignment and Resource Allocation for Hierarchical Federated
Learning over Wireless Networks [20.09415156099031]
階層FL(Hierarchical FL)は、効率的なリソース割り当てと適切なユーザ割り当てによって、エネルギー消費とレイテンシを低減する。
本稿では,スペクトル資源最適化アルゴリズム(SROA)とHFLのための2段階CPUアルゴリズム(TSIA)を提案する。
実験により,提案したHFLフレームワークは,エネルギーと遅延低減に関する既存の研究よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-09-17T12:10:39Z) - Wirelessly Powered Federated Learning Networks: Joint Power Transfer,
Data Sensing, Model Training, and Resource Allocation [24.077525032187893]
フェデレートラーニング(FL)は、無線ネットワークで多くの成功を収めている。
FLの実装は、モバイルデバイス(MD)のエネルギー制限と、MDにおけるトレーニングデータの可用性によって妨げられている。
無線送電と持続可能なFLネットワークの統合
論文 参考訳(メタデータ) (2023-08-09T13:38:58Z) - State-Augmented Learnable Algorithms for Resource Management in Wireless
Networks [124.89036526192268]
本稿では,無線ネットワークにおける資源管理問題を解決するためのステート拡張アルゴリズムを提案する。
提案アルゴリズムは, RRM決定を可能, ほぼ最適に行うことができることを示す。
論文 参考訳(メタデータ) (2022-07-05T18:02:54Z) - Computation Offloading and Resource Allocation in F-RANs: A Federated
Deep Reinforcement Learning Approach [67.06539298956854]
フォグ無線アクセスネットワーク(フォグ無線アクセスネットワーク、F-RAN)は、ユーザのモバイルデバイス(MD)が計算タスクを近くのフォグアクセスポイント(F-AP)にオフロードできる有望な技術である。
論文 参考訳(メタデータ) (2022-06-13T02:19:20Z) - Federated Learning for Energy-limited Wireless Networks: A Partial Model
Aggregation Approach [79.59560136273917]
デバイス間の限られた通信資源、帯域幅とエネルギー、およびデータ不均一性は、連邦学習(FL)の主要なボトルネックである
まず、部分モデルアグリゲーション(PMA)を用いた新しいFLフレームワークを考案する。
提案されたPMA-FLは、2つの典型的な異種データセットにおいて2.72%と11.6%の精度を改善する。
論文 参考訳(メタデータ) (2022-04-20T19:09:52Z) - Federated Learning over Wireless IoT Networks with Optimized
Communication and Resources [98.18365881575805]
協調学習技術のパラダイムとしてのフェデレートラーニング(FL)は研究の注目を集めている。
無線システム上での高速応答および高精度FLスキームの検証が重要である。
提案する通信効率のよいフェデレーション学習フレームワークは,強い線形速度で収束することを示す。
論文 参考訳(メタデータ) (2021-10-22T13:25:57Z) - Learning based E2E Energy Efficient in Joint Radio and NFV Resource
Allocation for 5G and Beyond Networks [21.60295771932728]
無線部に電力とスペクトル資源を割り当てる最適化問題を定式化する。
コア部では、すべてのユーザの効率を確保するために、関数の連鎖、配置、スケジューリングを行う。
次に、最大エントロピーフレームワークに基づくソフトアクター・クリティカル・ディープラーニング(SAC-DRL)アルゴリズムを用いて、上記のMDPを解く。
論文 参考訳(メタデータ) (2021-07-13T11:19:48Z) - Edge Intelligence for Energy-efficient Computation Offloading and
Resource Allocation in 5G Beyond [7.953533529450216]
さらに5Gは、エッジデバイス、エッジサーバ、クラウドの異種機能を活用可能な、エッジクラウドオーケストレーションネットワークである。
マルチユーザ無線ネットワークでは、多様なアプリケーション要件とデバイス間の通信のための様々な無線アクセスモードの可能性により、最適な計算オフロード方式の設計が困難になる。
深層強化学習(Dep Reinforcement Learning, DRL)は、そのような問題に限定的で精度の低いネットワーク情報で対処する新興技術である。
論文 参考訳(メタデータ) (2020-11-17T05:51:03Z) - When Deep Reinforcement Learning Meets Federated Learning: Intelligent
Multi-Timescale Resource Management for Multi-access Edge Computing in 5G
Ultra Dense Network [31.274279003934268]
まず,ブロックチェーンとAIを5Gエッジコンピューティングネットワークに統合した,インテリジェントな超高密度エッジコンピューティング(I-UDEC)フレームワークを提案する。
実時間および低オーバーヘッド計算のオフロード決定と資源配分戦略を実現するために,新しい2段階の深層強化学習法(textit2Ts-DRL)を設計する。
提案アルゴリズムはタスク実行時間を最大31.87%削減できる。
論文 参考訳(メタデータ) (2020-09-22T15:08:00Z) - Learning Centric Power Allocation for Edge Intelligence [84.16832516799289]
分散データを収集し、エッジで機械学習を実行するエッジインテリジェンスが提案されている。
本稿では,経験的分類誤差モデルに基づいて無線リソースを割り当てるLCPA法を提案する。
実験の結果,提案したLCPAアルゴリズムは,他のパワーアロケーションアルゴリズムよりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-21T07:02:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。