論文の概要: Collaborative Ground-Space Communications via Evolutionary Multi-objective Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2404.07450v1
- Date: Thu, 11 Apr 2024 03:13:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-12 15:08:41.570589
- Title: Collaborative Ground-Space Communications via Evolutionary Multi-objective Deep Reinforcement Learning
- Title(参考訳): 進化的多目的深層強化学習による協調的地上コミュニケーション
- Authors: Jiahui Li, Geng Sun, Qingqing Wu, Dusit Niyato, Jiawen Kang, Abbas Jamalipour, Victor C. M. Leung,
- Abstract要約: 地中直接通信を実現するために,分散コラボレーティブビームフォーミング(DCB)に基づくアップリンク通信パラダイムを提案する。
DCBは、低軌道(LEO)衛星と効率的な直接接続を確立することができない端末を分散アンテナとして扱う。
本稿では,進化的多目的深層強化学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 113.48727062141764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a distributed collaborative beamforming (DCB)-based uplink communication paradigm for enabling ground-space direct communications. Specifically, DCB treats the terminals that are unable to establish efficient direct connections with the low Earth orbit (LEO) satellites as distributed antennas, forming a virtual antenna array to enhance the terminal-to-satellite uplink achievable rates and durations. However, such systems need multiple trade-off policies that variously balance the terminal-satellite uplink achievable rate, energy consumption of terminals, and satellite switching frequency to satisfy the scenario requirement changes. Thus, we perform a multi-objective optimization analysis and formulate a long-term optimization problem. To address availability in different terminal cluster scales, we reformulate this problem into an action space-reduced and universal multi-objective Markov decision process. Then, we propose an evolutionary multi-objective deep reinforcement learning algorithm to obtain the desirable policies, in which the low-value actions are masked to speed up the training process. As such, the applicability of a one-time trained model can cover more changing terminal-satellite uplink scenarios. Simulation results show that the proposed algorithm outmatches various baselines, and draw some useful insights. Specifically, it is found that DCB enables terminals that cannot reach the uplink achievable threshold to achieve efficient direct uplink transmission, which thus reveals that DCB is an effective solution for enabling direct ground-space communications. Moreover, it reveals that the proposed algorithm achieves multiple policies favoring different objectives and achieving near-optimal uplink achievable rates with low switching frequency.
- Abstract(参考訳): 本稿では,地中直接通信を実現するために,分散コラボレーティブビームフォーミング(DCB)に基づくアップリンク通信パラダイムを提案する。
特に、DCBは、低軌道衛星(LEO)との効率的な直接接続を分散アンテナとして確立できない端末を扱い、仮想アンテナアレイを形成して、端末から衛星へのアップリンク達成率と持続時間を高める。
しかし、このようなシステムには、シナリオ要求の変化を満たすために、端末-衛星アップリンク達成率、端末のエネルギー消費、衛星切替周波数の様々なバランスをとる複数のトレードオフポリシーが必要である。
そこで我々は,多目的最適化分析を行い,長期最適化問題を定式化する。
異なる端末クラスタスケールでの可用性に対処するため、我々はこの問題をアクション空間を再現し、普遍的な多目的マルコフ決定プロセスに再構成する。
そこで本研究では,低値動作を隠蔽して学習プロセスを高速化する,進化的多目的深層強化学習アルゴリズムを提案する。
そのため、ワンタイムトレーニングモデルの適用性は、より変化する端末-衛星アップリンクシナリオをカバーすることができる。
シミュレーションの結果,提案アルゴリズムは様々なベースラインより優れており,いくつかの有用な知見が得られた。
具体的には、直流Bにより、アップリンク到達しきい値に到達できない端末を効率よく直接アップリンク伝送可能とし、直流Bが直接地上通信を実現する有効なソリューションであることを明らかにする。
さらに,提案アルゴリズムは,異なる目的を満足する複数のポリシーを達成し,スイッチング周波数の低い準最適アップリンク達成率を実現する。
関連論文リスト
- Latency Optimization in LEO Satellite Communications with Hybrid Beam Pattern and Interference Control [20.19239663262141]
低軌道(LEO)衛星通信システムは次世代用途に不可欠な高容量で低遅延のサービスを提供する。
LEO星座の密な構成は資源配分最適化と干渉管理の課題を提起する。
本稿では,マルチビームLEOシステムにおけるビームスケジューリングとリソース割り当てを最適化するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-14T17:18:24Z) - A Distance Similarity-based Genetic Optimization Algorithm for Satellite Ground Network Planning Considering Feeding Mode [53.71516191515285]
衛星データ中継ミッションの送信効率の低さは、現在システムの構築を制約している問題となっている。
本研究では,タスク間の状態特性を考慮した距離類似性に基づく遺伝的最適化アルゴリズム(DSGA)を提案し,タスク間の類似性を決定するための重み付きユークリッド距離法を提案する。
論文 参考訳(メタデータ) (2024-08-29T06:57:45Z) - Generalized Multi-Objective Reinforcement Learning with Envelope Updates in URLLC-enabled Vehicular Networks [12.323383132739195]
我々は,無線ネットワークの選択と自律運転ポリシーを協調的に最適化する,新しい多目的強化学習フレームワークを開発した。
提案フレームワークは,車両の運動力学を制御することにより,交通流の最大化と衝突の最小化を目的としている。
提案されたポリシーにより、自動運転車は、接続性を改善した安全な運転行動を採用することができる。
論文 参考訳(メタデータ) (2024-05-18T16:31:32Z) - UAV-assisted Semantic Communication with Hybrid Action Reinforcement
Learning [19.48293218551122]
本稿では, セマンティックモデルスケール, チャネル割り当て, 送信電力, UAV軌道に関する決定を行うためのハイブリッドアクション強化学習フレームワークを提案する。
シミュレーションの結果,提案したハイブリッドアクション強化学習フレームワークは,アップリンクセマンティックデータ収集の効率を効果的に向上できることが示された。
論文 参考訳(メタデータ) (2023-08-18T06:30:18Z) - Joint Optimization of Deployment and Trajectory in UAV and IRS-Assisted
IoT Data Collection System [25.32139119893323]
無人航空機(UAV)は多くのモノのインターネット(IoT)システムに適用できる。
UAV-IoT無線チャネルは、時には木や高層建築物によってブロックされることがある。
本稿では,UAVの展開と軌道を最適化することで,システムのエネルギー消費を最小化することを目的とする。
論文 参考訳(メタデータ) (2022-10-27T06:27:40Z) - Federated learning for LEO constellations via inter-HAP links [0.0]
ローアース・オービット(LEO)衛星星座は近年、急速に展開している。
このような応用に機械学習(ML)を適用するには、画像などの衛星データを地上局(GS)にダウンロードする従来の方法は望ましいものではない。
既存のFLソリューションは、過剰収束遅延や信頼できない無線チャネルといった大きな課題のために、そのようなLEOコンステレーションのシナリオには適さないことを示す。
論文 参考訳(メタデータ) (2022-05-15T08:22:52Z) - Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文 参考訳(メタデータ) (2020-11-23T21:45:01Z) - Distributional Reinforcement Learning for mmWave Communications with
Intelligent Reflectors on a UAV [119.97450366894718]
無人航空機(UAV)搭載のインテリジェントリフレクタ(IR)を用いた新しい通信フレームワークを提案する。
ダウンリンク和率を最大化するために、最適プリコーディング行列(基地局)と反射係数(IR)を共同で導出する。
論文 参考訳(メタデータ) (2020-11-03T16:50:37Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。