論文の概要: Distributed Uplink Beamforming in Cell-Free Networks Using Deep
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2006.15138v2
- Date: Thu, 21 Oct 2021 20:32:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 22:16:06.260672
- Title: Distributed Uplink Beamforming in Cell-Free Networks Using Deep
Reinforcement Learning
- Title(参考訳): 深層強化学習を用いたセルフリーネットワークにおける分散アップリンクビームフォーミング
- Authors: Firas Fredj, Yasser Al-Eryani, Setareh Maghsudi, Mohamed Akrout, and
Ekram Hossain
- Abstract要約: 本稿では,集中処理,半分散処理,完全分散処理を備えたアップリンクセルフリーネットワークのためのビームフォーミング手法を提案する。
分散ビームフォーミング手法は,小規模ネットワークのみを対象とした集中学習によるDDPGアルゴリズムよりも優れていた。
- 参考スコア(独自算出の注目度): 25.579612460904873
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The emergence of new wireless technologies together with the requirement of
massive connectivity results in several technical issues such as excessive
interference, high computational demand for signal processing, and lengthy
processing delays. In this work, we propose several beamforming techniques for
an uplink cell-free network with centralized, semi-distributed, and fully
distributed processing, all based on deep reinforcement learning (DRL). First,
we propose a fully centralized beamforming method that uses the deep
deterministic policy gradient algorithm (DDPG) with continuous space. We then
enhance this method by enabling distributed experience at access points (AP).
Indeed, we develop a beamforming scheme that uses the distributed
distributional deterministic policy gradients algorithm (D4PG) with the APs
representing the distributed agents. Finally, to decrease the computational
complexity, we propose a fully distributed beamforming scheme that divides the
beamforming computations among APs. The results show that the D4PG scheme with
distributed experience achieves the best performance irrespective of the
network size. Furthermore, the proposed distributed beamforming technique
performs better than the DDPG algorithm with centralized learning only for
small-scale networks. The performance superiority of the DDPG model becomes
more evident as the number of APs and/or users increases. Moreover, during the
operation stage, all DRL models demonstrate a significantly shorter processing
time than that of the conventional gradient descent (GD) solution.
- Abstract(参考訳): 新しい無線技術の出現と大規模接続の要求は、過度な干渉、信号処理に対する高い計算需要、長い処理遅延といったいくつかの技術的問題をもたらす。
本研究では,深部強化学習(DRL)に基づく,集中型,半分散型,完全分散処理を備えたアップリンクセルフリーネットワークのためのビームフォーミング手法を提案する。
まず,連続空間を持つDeep Deterministic Policy gradient Algorithm (DDPG) を用いた全集中ビームフォーミング法を提案する。
次に、アクセスポイント(AP)における分散体験を可能にすることにより、この手法を強化する。
実際、分散分布決定性ポリシー勾配アルゴリズム(D4PG)を用いて、分散エージェントを表すAPを用いてビームフォーミング方式を開発する。
最後に, 計算複雑性を低減するため, ビームフォーミング計算をapsに分割する完全分散ビームフォーミングスキームを提案する。
その結果,分散経験を持つD4PG方式は,ネットワークサイズに関わらず,最高の性能が得られることがわかった。
さらに,分散ビームフォーミング手法は,小規模ネットワークに限って集中学習を行うDDPGアルゴリズムよりも優れていた。
DDPGモデルの性能上の優位性は、APやユーザの増加に伴ってより明確になる。
さらに, 運転段階において, 全てのDRLモデルは従来の勾配降下(GD)溶液よりも処理時間が有意に短いことを示した。
関連論文リスト
- FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - Unsupervised Graph-based Learning Method for Sub-band Allocation in 6G Subnetworks [2.0583251142940377]
グラフベース学習を用いた無線ネットワークにおける周波数サブバンド割り当てのための教師なし手法を提案する。
サブネットワーク配置を競合グラフとしてモデル化し,グラフカラー化とPottsモデルにインスパイアされた教師なし学習アプローチを提案し,サブバンド割り当てを最適化する。
論文 参考訳(メタデータ) (2023-12-13T12:57:55Z) - Inter-Cell Network Slicing With Transfer Learning Empowered Multi-Agent
Deep Reinforcement Learning [6.523367518762879]
ネットワークスライシングにより、オペレータは共通の物理インフラ上で多様なアプリケーションを効率的にサポートできる。
ネットワーク展開の恒常的に増大する密度化は、複雑で非自明な細胞間干渉を引き起こす。
複数の深層強化学習(DRL)エージェントを用いたDIRPアルゴリズムを開発し,各セルの資源分配を協調的に最適化する。
論文 参考訳(メタデータ) (2023-06-20T14:14:59Z) - Decentralized Federated Reinforcement Learning for User-Centric Dynamic
TFDD Control [37.54493447920386]
非対称かつ不均一なトラフィック要求を満たすための学習に基づく動的時間周波数分割二重化(D-TFDD)方式を提案する。
分散化された部分観測可能なマルコフ決定過程(Dec-POMDP)として問題を定式化する。
本稿では,グローバルリソースを分散的に最適化するために,Wolpertinger Deep Deterministic Policy gradient (FWDDPG)アルゴリズムという,連合強化学習(RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-04T07:39:21Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z) - Limited-Fronthaul Cell-Free Hybrid Beamforming with Distributed Deep
Neural Network [0.0]
近接最適解は、アクセスポイント(AP)とネットワークコントローラ(NC)の間で大量の信号交換を必要とする。
本稿では,AP と NC 間の通信オーバーヘッドをゼロあるいは限定して協調ハイブリッドビームフォーミングを行うことができる2つの非教師なしディープニューラルネットワーク(DNN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-06-30T16:42:32Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z) - Multiple Access in Dynamic Cell-Free Networks: Outage Performance and
Deep Reinforcement Learning-Based Design [24.632250413917816]
将来のセルフリー(またはセルレス)無線ネットワークでは、地理的領域の多数のデバイスが同時に多数の分散アクセスポイント(AP)によって提供される。
我々は,多数のデバイスやAPが存在する場合に,ユーザの信号の共同処理の複雑さを低減するために,新しい動的セルフリーネットワークアーキテクチャを提案する。
システム設定では, DDPG-DDQN方式は, 網羅的な検索ベース設計により, 達成可能なレートの約78%を達成できることがわかった。
論文 参考訳(メタデータ) (2020-01-29T03:00:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。