論文の概要: Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2203.14152v1
- Date: Sat, 26 Mar 2022 20:37:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 17:29:48.290045
- Title: Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習による協調的インテリジェント反射面ネットワーク
- Authors: Jie Zhang, Jun Li, Yijin Zhang, Qingqing Wu, Xiongwei Wu, Feng Shu,
Shi Jin, Wen Chen
- Abstract要約: インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
- 参考スコア(独自算出の注目度): 63.83425382922157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent reflecting surface (IRS) is envisioned to be widely applied in
future wireless networks. In this paper, we investigate a multi-user
communication system assisted by cooperative IRS devices with the capability of
energy harvesting. Aiming to maximize the long-term average achievable system
rate, an optimization problem is formulated by jointly designing the transmit
beamforming at the base station (BS) and discrete phase shift beamforming at
the IRSs, with the constraints on transmit power, user data rate requirement
and IRS energy buffer size. Considering time-varying channels and stochastic
arrivals of energy harvested by the IRSs, we first formulate the problem as a
Markov decision process (MDP) and then develop a novel multi-agent Q-mix (MAQ)
framework with two layers to decouple the optimization parameters. The higher
layer is for optimizing phase shift resolutions, and the lower one is for phase
shift beamforming and power allocation. Since the phase shift optimization is
an integer programming problem with a large-scale action space, we improve MAQ
by incorporating the Wolpertinger method, namely, MAQ-WP algorithm to achieve a
sub-optimality with reduced dimensions of action space. In addition, as MAQ-WP
is still of high complexity to achieve good performance, we propose a policy
gradient-based MAQ algorithm, namely, MAQ-PG, by mapping the discrete phase
shift actions into a continuous space at the cost of a slight performance loss.
Simulation results demonstrate that the proposed MAQ-WP and MAQ-PG algorithms
can converge faster and achieve data rate improvements of 10.7% and 8.8% over
the conventional multi-agent DDPG, respectively.
- Abstract(参考訳): インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く適用される予定である。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
基地局(BS)における送信ビームフォーミングとIRSにおける離散位相シフトビームフォーミングを共同で設計し、送信電力、ユーザデータレート要求、IRSエネルギーバッファサイズに制約を加えることにより、長期平均達成システムレートを最大化する最適化問題を定式化する。
IRSによって得られたエネルギーの時間変化チャネルと確率的到着を考慮し、まずマルコフ決定過程(MDP)として問題を定式化し、最適化パラメータを2層に分離する新しいマルチエージェントQ-mix(MAQ)フレームワークを開発する。
上位層は位相シフト解像度を最適化し、下位層は位相シフトビームフォーミングとパワーアロケーションを行う。
位相シフト最適化は大規模なアクション空間を持つ整数プログラミング問題であるため、Wolpertinger法、すなわちMAQ-WPアルゴリズムを導入して、アクション空間の次元を縮小したサブ最適化を実現することにより、MAQを改善する。
さらに,MAQ-WPは依然として高い複雑性を有するため,離散位相シフト動作を連続空間にマッピングすることで,政策勾配に基づくMAQアルゴリズム,すなわちMAQ-PGを提案する。
シミュレーションの結果,MAQ-WPアルゴリズムとMAQ-PGアルゴリズムはより高速に収束し,従来のマルチエージェントDDPGよりも10.7%,8.8%の速度向上を実現している。
関連論文リスト
- Smart energy management: process structure-based hybrid neural networks for optimal scheduling and economic predictive control in integrated systems [2.723192806018494]
統合エネルギーシステム(IES)は、複数のドメインにまたがる多様な操作ユニットからなる複雑なシステムである。
複数の時間スケールでIESの動的性能を予測するために,物理インフォームドなハイブリッド時系列ニューラルネットワーク(NN)を提案する。
論文 参考訳(メタデータ) (2024-10-07T04:24:39Z) - Quantum Multi-Agent Reinforcement Learning for Autonomous Mobility
Cooperation [14.606459096293088]
本稿ではアクター・クリティカルネットワークの概念に基づく量子MARL(QMARL)アルゴリズムを提案する。
我々のQMARLは、量子超越性による効率的なパラメータ利用と高速収束の点で有益である。
プロジェクション値測度(PVM)と呼ばれる拡張性のための新たな手法が提案されている。
論文 参考訳(メタデータ) (2023-08-03T03:29:25Z) - Active RIS-aided EH-NOMA Networks: A Deep Reinforcement Learning
Approach [66.53364438507208]
アクティブな再構成可能なインテリジェントサーフェス(RIS)支援マルチユーザダウンリンク通信システムについて検討した。
非直交多重アクセス(NOMA)はスペクトル効率を向上させるために使用され、活性RISはエネルギー回収(EH)によって駆動される。
ユーザの動的通信状態を予測するために,高度なLSTMベースのアルゴリズムを開発した。
増幅行列と位相シフト行列RISを結合制御するためにDDPGに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-11T13:16:28Z) - Energy Efficiency Maximization in IRS-Aided Cell-Free Massive MIMO
System [2.9081408997650375]
本稿では、入射点におけるビームフォーミングとIRSにおける位相シフトを共同最適化してエネルギー効率(EE)を最大化する、インテリジェント反射面(IRS)を用いたセルレス大規模マルチインプット多重出力システムについて考察する。
EE問題を解くために,2次変換とラグランジアン双対変換を用いて最適ビームフォーミングと位相シフトを求める反復最適化アルゴリズムを提案する。
さらに,共同ビームフォーミングと位相シフト設計のための深層学習に基づくアプローチを提案する。具体的には,教師なし学習方式を用いて2段階の深層ニューラルネットワークをオフラインでトレーニングし,オンラインに展開する。
論文 参考訳(メタデータ) (2022-12-24T14:58:15Z) - Intelligent Trajectory Design for RIS-NOMA aided Multi-robot
Communications [59.34642007625687]
目的は,ロボットの軌道とNOMA復号命令を協調的に最適化することで,マルチロボットシステムにおける全軌道の総和率を最大化することである。
ARIMAモデルとDouble Deep Q-network (D$3$QN)アルゴリズムを組み合わせたML方式を提案する。
論文 参考訳(メタデータ) (2022-05-03T17:14:47Z) - Federated Learning for Energy-limited Wireless Networks: A Partial Model
Aggregation Approach [79.59560136273917]
デバイス間の限られた通信資源、帯域幅とエネルギー、およびデータ不均一性は、連邦学習(FL)の主要なボトルネックである
まず、部分モデルアグリゲーション(PMA)を用いた新しいFLフレームワークを考案する。
提案されたPMA-FLは、2つの典型的な異種データセットにおいて2.72%と11.6%の精度を改善する。
論文 参考訳(メタデータ) (2022-04-20T19:09:52Z) - A Robust Deep Learning-Based Beamforming Design for RIS-assisted
Multiuser MISO Communications with Practical Constraints [4.727307803726522]
RIS支援マルチユーザマルチインプットシングルアウトプットダウンリンク通信システムについて検討する。
我々は、アクティブビームフォーミングとパッシブビームフォーミングを同時に設計するディープ量子化ニューラルネットワーク(DQNN)を開発した。
提案した2つのDQNNアルゴリズムは、離散位相シフトと不完全なCSIが同時に考慮される場合に拡張する。
論文 参考訳(メタデータ) (2021-11-12T03:53:20Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - Federated Learning via Intelligent Reflecting Surface [30.935389187215474]
オーバー・ザ・エア・コンピューティング・アルゴリズム(FL)は,複数のアクセスチャネルの波形重畳特性を利用して高速なモデルアグリゲーションを実現することができる。
本稿では,AirCompベースのFLのための高速かつ信頼性の高いモデルアグリゲーションを実現するための2段階最適化フレームワークを提案する。
シミュレーションの結果,提案するフレームワークとIRSの展開により,ベースラインアルゴリズムよりもトレーニング損失が低く,FL予測精度も高いことがわかった。
論文 参考訳(メタデータ) (2020-11-10T11:29:57Z) - Iterative Algorithm Induced Deep-Unfolding Neural Networks: Precoding
Design for Multiuser MIMO Systems [59.804810122136345]
本稿では,AIIDNN(ディープ・アンフォールディング・ニューラルネット)を一般化した,ディープ・アンフォールディングのためのフレームワークを提案する。
古典的重み付き最小二乗誤差(WMMSE)反復アルゴリズムの構造に基づく効率的なIAIDNNを提案する。
提案したIAIDNNは,計算複雑性を低減した反復WMMSEアルゴリズムの性能を効率よく向上することを示す。
論文 参考訳(メタデータ) (2020-06-15T02:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。