論文の概要: Distributed Deep Reinforcement Learning for Adaptive Medium Access and
Modulation in Shared Spectrum
- arxiv url: http://arxiv.org/abs/2109.11723v1
- Date: Fri, 24 Sep 2021 03:33:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-27 14:03:21.315201
- Title: Distributed Deep Reinforcement Learning for Adaptive Medium Access and
Modulation in Shared Spectrum
- Title(参考訳): 共有スペクトルにおける適応媒体アクセスと変調のための分散深層強化学習
- Authors: Akash Doshi and Jeffrey G. Andrews
- Abstract要約: 本研究では,非ライセンス共有スペクトルで動作する基地局の分散競合に基づく媒体アクセスについて検討する。
我々は,ネットワーク全体のダウンリンクスループットを最大化するために,競合と適応変調の両方のための学習に基づくアルゴリズムを考案した。
実証的に、政策勾配法によって蓄積された(比例的公正性)報酬は、ジェニーエイドによる適応エネルギー検出閾値よりも著しく高い。
- 参考スコア(独自算出の注目度): 42.54329256803276
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spectrum scarcity has led to growth in the use of unlicensed spectrum for
cellular systems. This motivates intelligent adaptive approaches to spectrum
access for both WiFi and 5G that improve upon traditional carrier sensing and
listen-before-talk methods. We study decentralized contention-based medium
access for base stations (BSs) of a single Radio Access Technology (RAT)
operating on unlicensed shared spectrum. We devise a learning-based algorithm
for both contention and adaptive modulation that attempts to maximize a
network-wide downlink throughput objective. We formulate and develop novel
distributed implementations of two deep reinforcement learning approaches -
Deep Q Networks and Proximal Policy Optimization - modelled on a two stage
Markov decision process. Empirically, we find the (proportional fairness)
reward accumulated by the policy gradient approach to be significantly higher
than even a genie-aided adaptive energy detection threshold. Our approaches are
further validated by improved sum and peak throughput. The scalability of our
approach to large networks is demonstrated via an improved cumulative reward
earned on both indoor and outdoor layouts with a large number of BSs.
- Abstract(参考訳): スペクトル不足は、セルシステムに対する無許可スペクトルの使用の増加につながった。
これにより、WiFiと5Gの両方のスペクトルアクセスに対するインテリジェントな適応的アプローチが動機となり、従来のキャリアセンシングやリス・バイ・トークの手法が改善される。
単一無線アクセス技術(rat)の基地局(bss)に対する非ライセンス共有スペクトル上での分散競合ベースの媒体アクセスについて検討した。
本稿では,ネットワーク全体のダウンリンクスループット目標を最大化しようとする,競合と適応変調の両方に対する学習ベースのアルゴリズムを考案する。
我々は,2段階のマルコフ決定過程をモデル化した2つの深層強化学習手法の新たな分散実装を定式化し,開発する。
実証的に、政策勾配法によって蓄積された(比例的公正性)報酬は、ジェニーエイドによる適応エネルギー検出閾値よりも著しく高い。
我々のアプローチは、sumとピークスループットの改善によってさらに検証される。
大規模ネットワークに対する我々のアプローチのスケーラビリティは,BSを多用した屋内および屋外レイアウトの累積報酬の改善によって実証される。
関連論文リスト
- Dynamic Spectrum Access for Ambient Backscatter Communication-assisted D2D Systems with Quantum Reinforcement Learning [68.63990729719369]
無線スペクトルは乏しくなり、D2D通信のスペクトル効率は低い。
本稿では, 周囲RF信号の後方散乱を可能にするために, 環境後方散乱通信技術をD2Dデバイスに統合することを目的とする。
我々は、より少ないトレーニングパラメータでより高速な収束率を達成することができる新しい量子強化学習(RL)アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-10-23T15:36:43Z) - Label-free Deep Learning Driven Secure Access Selection in
Space-Air-Ground Integrated Networks [26.225658457052834]
宇宙空間統合ネットワーク(SAGIN)では、固有のオープン性と広範な放送範囲が、これらのネットワークを盗聴の脅威に晒している。
異種資源と異なる盗聴モデルの両方により、秘密指向のアクセス戦略を実行することは困難である。
本稿では,Q-network を用いたディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2023-08-28T06:48:06Z) - An Unsupervised Learning Approach for Spectrum Allocation in Terahertz
Communication Systems [31.263991262752498]
テラヘルツ通信システムにおける教師なし学習を支援する新しいスペクトル割当戦略を提案する。
まず、最適化問題を定式化し、最適なサブバンド帯域幅を決定し、電力を伝送する。
そこで本研究では,教師なし学習に基づく問題解決手法を提案する。
論文 参考訳(メタデータ) (2022-08-07T02:14:13Z) - Distributed Proximal Policy Optimization for Contention-Based Spectrum
Access [40.99534735484468]
本稿では,ポリシ最適化と呼ばれるポリシ勾配法を分散的に実装する。
各タイムスロットにおいて、基地局は、スペクトルセンシングおよび受信品質の情報を使用して、所定のリソースで送信するか否かを自律的に決定する。
政策勾配法により蓄積された正当性報酬は、ジェニーエイドによる適応エネルギー検出閾値よりも有意に高い。
論文 参考訳(メタデータ) (2021-10-07T00:54:03Z) - A Deep Reinforcement Learning Framework for Contention-Based Spectrum
Sharing [31.640828282666245]
我々は、無許可の共有スペクトルで動作する基地局の分散競合に基づく媒体アクセスについて検討する。
各タイムスロットに2段階のマルコフ決定プロセスを導入し、スペクトルセンシングと受信品質の情報を用いて媒体アクセス決定を行う。
我々の定式化は、分散推論、オンライン適応性、および環境の一部的な可観測性を提供する。
論文 参考訳(メタデータ) (2021-10-05T03:00:33Z) - Cooperative Multi-Agent Reinforcement Learning Based Distributed Dynamic
Spectrum Access in Cognitive Radio Networks [46.723006378363785]
ダイナミックスペクトルアクセス(DSA)は、非効率的なスペクトル利用の問題を改善するための、有望なパラダイムである。
本稿では,一般的な認知無線ネットワークにおけるマルチユーザに対する分散DSA問題について検討する。
我々は、各認知ユーザに対する状態の部分的観測可能性に対処するために、DRQN(Deep Recurrent Q-network)を用いている。
論文 参考訳(メタデータ) (2021-06-17T06:52:21Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。