論文の概要: Sum Rate Maximization in STAR-RIS-UAV-Assisted Networks: A CA-DDPG Approach for Joint Optimization
- arxiv url: http://arxiv.org/abs/2512.01202v1
- Date: Mon, 01 Dec 2025 02:36:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.64153
- Title: Sum Rate Maximization in STAR-RIS-UAV-Assisted Networks: A CA-DDPG Approach for Joint Optimization
- Title(参考訳): STAR-RIS-UAV支援ネットワークにおける最大速度最大化:共同最適化のためのCA-DDPGアプローチ
- Authors: Yujie Huang, Haibin Wan, Xiangcheng Li, Tuanfa Qin, Yun Li, Jun Li, Wen Chen,
- Abstract要約: 本稿では,STAR-RIS-UAV支援無線通信システムのスペクトル効率を最適化するための無人航空機(UAV)を提案する。
本稿では,ビームフォーミング,位相シフト,UAV位置を反復的に最適化し,環境との連続的な相互作用を通じてシステムの総和率を最大化する深部強化学習(DRL)アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 12.38744459760065
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the rapid advances in programmable materials, reconfigurable intelligent surfaces (RIS) have become a pivotal technology for future wireless communications. The simultaneous transmitting and reflecting reconfigurable intelligent surfaces (STAR-RIS) can both transmit and reflect signals, enabling comprehensive signal control and expanding application scenarios. This paper introduces an unmanned aerial vehicle (UAV) to further enhance system flexibility and proposes an optimization design for the spectrum efficiency of the STAR-RIS-UAV-assisted wireless communication system. We present a deep reinforcement learning (DRL) algorithm capable of iteratively optimizing beamforming, phase shifts, and UAV positioning to maximize the system's sum rate through continuous interactions with the environment. To improve exploration in deterministic policies, we introduce a stochastic perturbation factor, which enhances exploration capabilities. As exploration is strengthened, the algorithm's ability to accurately evaluate the state-action value function becomes critical. Thus, based on the deep deterministic policy gradient (DDPG) algorithm, we propose a convolution-augmented deep deterministic policy gradient (CA-DDPG) algorithm that balances exploration and evaluation to improve the system's sum rate. The simulation results demonstrate that the CA-DDPG algorithm effectively interacts with the environment, optimizing the beamforming matrix, phase shift matrix, and UAV location, thereby improving system capacity and achieving better performance than other algorithms.
- Abstract(参考訳): プログラム可能な素材の急速な進歩により、再構成可能なインテリジェントサーフェス(RIS)は将来の無線通信において重要な技術となっている。
同時送信および再構成可能なインテリジェントサーフェス(STAR-RIS)は、信号の送信と反射の両方を可能にし、包括的な信号制御とアプリケーションシナリオの拡張を可能にする。
本稿では,STAR-RIS-UAV支援無線通信システムのスペクトル効率を最適化するための無人航空機(UAV)を提案する。
本稿では,ビームフォーミング,位相シフト,UAV位置を反復的に最適化し,環境との連続的な相互作用を通じてシステムの総和率を最大化する深部強化学習(DRL)アルゴリズムを提案する。
決定論的政策の探索を改善するために,探索能力を高める確率的摂動係数を導入する。
探索が強化されるにつれて、状態-作用値関数を正確に評価するアルゴリズムの能力が重要になる。
そこで本研究では, 深層決定主義政策勾配(DDPG)アルゴリズムに基づいて, 探索と評価のバランスを保ち, システムの総和率を改善するための畳み込み強化深部決定主義政策勾配(CA-DDPG)アルゴリズムを提案する。
シミュレーションの結果、CA-DDPGアルゴリズムは、ビームフォーミング行列、位相シフト行列、UAV位置を最適化し、システムキャパシティを向上し、他のアルゴリズムよりも優れた性能を実現する。
関連論文リスト
- Reconfigurable Intelligent Surface Aided Vehicular Edge Computing: Joint Phase-shift Optimization and Multi-User Power Allocation [28.47670676456068]
本稿では、車載通信を支援するための代替通信経路を提供するRIS(Reconfigurable Intelligent Surfaces)について紹介する。
本稿では、RIS位相シフト係数を最適化するDeep Deterministic Policy Gradient(DDPG)アルゴリズムと、車両ユーザ(VU)の電力配分を最適化するMulti-Agent Deep Deterministic Policy Gradient(MADDPG)アルゴリズムを組み合わせたDRLフレームワークを提案する。
シミュレーションの結果,提案手法は従来の集中型DDPG, Twin Delayed Deep Deterministic Policy Gradient (TD3) およびいくつかの典型的なスキームよりも優れていた。
論文 参考訳(メタデータ) (2024-07-18T03:18:59Z) - Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.63921041249406]
非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。
STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。
複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文 参考訳(メタデータ) (2024-06-19T07:17:04Z) - Active RIS-aided EH-NOMA Networks: A Deep Reinforcement Learning
Approach [66.53364438507208]
アクティブな再構成可能なインテリジェントサーフェス(RIS)支援マルチユーザダウンリンク通信システムについて検討した。
非直交多重アクセス(NOMA)はスペクトル効率を向上させるために使用され、活性RISはエネルギー回収(EH)によって駆動される。
ユーザの動的通信状態を予測するために,高度なLSTMベースのアルゴリズムを開発した。
増幅行列と位相シフト行列RISを結合制御するためにDDPGに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-11T13:16:28Z) - DRL Enabled Coverage and Capacity Optimization in STAR-RIS Assisted
Networks [55.0821435415241]
無線通信における新たなパラダイムとして,STAR-RISのカバレッジとキャパシティ性能の分析が不可欠だが難しい。
STAR-RIS支援ネットワークにおけるカバレッジとキャパシティ最適化の問題を解決するために,多目的ポリシー最適化(MO-PPO)アルゴリズムを提案する。
MO-PPOアルゴリズムの性能向上のために、アクション値ベースの更新戦略(AVUS)と損失関数ベースの更新戦略(LFUS)の2つの更新戦略を検討した。
論文 参考訳(メタデータ) (2022-09-01T14:54:36Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。