論文の概要: Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications
- arxiv url: http://arxiv.org/abs/2005.11885v1
- Date: Mon, 25 May 2020 01:42:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 06:32:15.087461
- Title: Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications
- Title(参考訳): IRS支援無線通信におけるロバストビームフォーミングの最適化による深部強化学習
- Authors: Jiaye Lin, Yuze Zou, Xiaoru Dong, Shimin Gong, Dinh Thai Hoang, Dusit
Niyato
- Abstract要約: Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
- 参考スコア(独自算出の注目度): 54.610318402371185
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent reflecting surface (IRS) is a promising technology to assist
downlink information transmissions from a multi-antenna access point (AP) to a
receiver. In this paper, we minimize the AP's transmit power by a joint
optimization of the AP's active beamforming and the IRS's passive beamforming.
Due to uncertain channel conditions, we formulate a robust power minimization
problem subject to the receiver's signal-to-noise ratio (SNR) requirement and
the IRS's power budget constraint. We propose a deep reinforcement learning
(DRL) approach that can adapt the beamforming strategies from past experiences.
To improve the learning performance, we derive a convex approximation as a
lower bound on the robust problem, which is integrated into the DRL framework
and thus promoting a novel optimization-driven deep deterministic policy
gradient (DDPG) approach. In particular, when the DDPG algorithm generates a
part of the action (e.g., passive beamforming), we can use the model-based
convex approximation to optimize the other part (e.g., active beamforming) of
the action more efficiently. Our simulation results demonstrate that the
optimization-driven DDPG algorithm can improve both the learning rate and
reward performance significantly compared to the conventional model-free DDPG
algorithm.
- Abstract(参考訳): Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
本稿では,APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを併用することにより,APの送信電力を最小化する。
チャネル条件の不確かさから,受信者の信号対雑音比(snr)要件とirsの電力予算制約に基づくロバストな電力最小化問題を定式化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
学習性能を向上させるために,drlフレームワークに統合されたロバスト問題に対する下限として凸近似を導出し,新しい最適化駆動型深決定論的政策勾配(ddpg)アプローチを促進する。
特に、DDPGアルゴリズムがアクションの一部(例えば受動ビームフォーミング)を生成すると、モデルベースの凸近似を用いてアクションの他の部分(例えばアクティブビームフォーミング)をより効率的に最適化することができる。
シミュレーションの結果,従来のDDPGアルゴリズムと比較して,最適化駆動型DDPGアルゴリズムは学習率と報奨性能の両方を向上できることが示された。
関連論文リスト
- Lyapunov-Driven Deep Reinforcement Learning for Edge Inference Empowered
by Reconfigurable Intelligent Surfaces [30.1512069754603]
本稿では,ワイヤレスエッジにおけるエネルギー効率,低レイテンシ,高精度な推論のための新しいアルゴリズムを提案する。
本稿では,新しいデータを一連のデバイスで連続的に生成・収集し,動的キューシステムを通じて処理するシナリオについて考察する。
論文 参考訳(メタデータ) (2023-05-18T12:46:42Z) - Learning Optimal Antenna Tilt Control Policies: A Contextual Linear
Bandit Approach [65.27783264330711]
セルラーネットワークにおけるアンテナ傾きの制御は、ネットワークのカバレッジとキャパシティの間の効率的なトレードオフに到達するために不可欠である。
既存のデータから最適な傾き制御ポリシーを学習するアルゴリズムを考案する。
従来のルールベースの学習アルゴリズムよりもはるかに少ないデータサンプルを用いて最適な傾き更新ポリシーを作成できることを示す。
論文 参考訳(メタデータ) (2022-01-06T18:24:30Z) - Learning OFDM Waveforms with PAPR and ACLR Constraints [15.423422040627331]
達成可能な情報レートを最大化しつつ,選択した制約を満たすOFDMベースの波形を設計するための学習ベース手法を提案する。
エンドツーエンドシステムは,PAPRとACLRの制約を満たすことができ,スループットを著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2021-10-21T08:58:59Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文 参考訳(メタデータ) (2020-11-23T21:45:01Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z) - Optimization-driven Machine Learning for Intelligent Reflecting Surfaces
Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。
散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。
本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-29T08:39:43Z) - Deep Reinforcement Learning Control for Radar Detection and Tracking in
Congested Spectral Environments [8.103366584285645]
レーダは、他のシステムとの相互干渉を軽減するために、その線形周波数変調(LFM)波形の帯域幅と中心周波数を変化させることを学ぶ。
DQLベースのアプローチを拡張して、ダブルQ-ラーニングとリカレントニューラルネットワークを組み込んで、ダブルディープリカレントQ-ネットワークを形成する。
実験結果から,提案手法は集束スペクトル環境におけるレーダ検出性能を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2020-06-23T17:21:28Z) - A Reinforcement Learning based approach for Multi-target Detection in
Massive MIMO radar [12.982044791524494]
本稿では,MMIMO(Multiple input Multiple output)認知レーダ(CR)におけるマルチターゲット検出の問題点について考察する。
本稿では,未知の外乱統計の存在下での認知的マルチターゲット検出のための強化学習(RL)に基づくアルゴリズムを提案する。
定常環境と動的環境の両方において提案したRLアルゴリズムの性能を評価するため, 数値シミュレーションを行った。
論文 参考訳(メタデータ) (2020-05-10T16:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。