論文の概要: A Deep Reinforcement Learning Framework for Contention-Based Spectrum
Sharing
- arxiv url: http://arxiv.org/abs/2110.02736v1
- Date: Tue, 5 Oct 2021 03:00:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-07 14:08:01.991286
- Title: A Deep Reinforcement Learning Framework for Contention-Based Spectrum
Sharing
- Title(参考訳): コンテントベーススペクトル共有のための深層強化学習フレームワーク
- Authors: Akash Doshi, Srinivas Yerramalli, Lorenzo Ferrari, Taesang Yoo,
Jeffrey G. Andrews
- Abstract要約: 我々は、無許可の共有スペクトルで動作する基地局の分散競合に基づく媒体アクセスについて検討する。
各タイムスロットに2段階のマルコフ決定プロセスを導入し、スペクトルセンシングと受信品質の情報を用いて媒体アクセス決定を行う。
我々の定式化は、分散推論、オンライン適応性、および環境の一部的な可観測性を提供する。
- 参考スコア(独自算出の注目度): 31.640828282666245
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The increasing number of wireless devices operating in unlicensed spectrum
motivates the development of intelligent adaptive approaches to spectrum
access. We consider decentralized contention-based medium access for base
stations (BSs) operating on unlicensed shared spectrum, where each BS
autonomously decides whether or not to transmit on a given resource. The
contention decision attempts to maximize not its own downlink throughput, but
rather a network-wide objective. We formulate this problem as a decentralized
partially observable Markov decision process with a novel reward structure that
provides long term proportional fairness in terms of throughput. We then
introduce a two-stage Markov decision process in each time slot that uses
information from spectrum sensing and reception quality to make a medium access
decision. Finally, we incorporate these features into a distributed
reinforcement learning framework for contention-based spectrum access. Our
formulation provides decentralized inference, online adaptability and also
caters to partial observability of the environment through recurrent
Q-learning. Empirically, we find its maximization of the proportional fairness
metric to be competitive with a genie-aided adaptive energy detection
threshold, while being robust to channel fading and small contention windows.
- Abstract(参考訳): 非ライセンススペクトルで動作する無線デバイスの増加は、スペクトルアクセスに対するインテリジェントな適応アプローチの開発を動機付ける。
我々は、非ライセンス共有スペクトルで動作する基地局(bss)に対する分散競合ベースの媒体アクセスについて検討し、各bsは、与えられたリソースで送信するか否かを自律的に決定する。
競合決定は、独自のダウンリンクスループットではなく、ネットワーク全体の目標を最大化しようとするものだ。
我々は、この問題を、スループットの観点から長期的な比例公平性を提供する新しい報酬構造により、分散した部分観測可能なマルコフ決定プロセスとして定式化する。
次に、各タイムスロットに2段階のマルコフ決定プロセスを導入し、スペクトルセンシングと受信品質の情報を用いて媒体アクセス決定を行う。
最後に、これらの特徴を競合ベースのスペクトルアクセスのための分散強化学習フレームワークに組み込む。
提案方式は分散推論やオンライン適応性を提供し,q-learningの繰り返しを通じて環境の部分的可観測性にも寄与する。
経験的に、比例フェアネスメトリックの最大化は、チャネルフェージングや小さな競合ウィンドウに頑健でありながら、ゲニー支援の適応エネルギー検出しきい値と競合することが判明した。
関連論文リスト
- Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - Learning Resilient Radio Resource Management Policies with Graph Neural
Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。
有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。
このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文 参考訳(メタデータ) (2022-03-07T19:40:39Z) - A Q-Learning-based Approach for Distributed Beam Scheduling in mmWave
Networks [18.22250038264899]
ミリ波(mmWave)セルネットワークにおける分散ダウンリンクビームスケジューリングと電力配分の問題点を考察する。
異なるサービス事業者に属する複数の基地局は同じ無許可のスペクトルを共有しており、中心的な調整や協調は行われていない。
本稿では,各BSを独立したQ学習エージェントとしてモデル化し,分散スケジューリング手法を提案する。
論文 参考訳(メタデータ) (2021-10-17T02:58:13Z) - Distributed Proximal Policy Optimization for Contention-Based Spectrum
Access [40.99534735484468]
本稿では,ポリシ最適化と呼ばれるポリシ勾配法を分散的に実装する。
各タイムスロットにおいて、基地局は、スペクトルセンシングおよび受信品質の情報を使用して、所定のリソースで送信するか否かを自律的に決定する。
政策勾配法により蓄積された正当性報酬は、ジェニーエイドによる適応エネルギー検出閾値よりも有意に高い。
論文 参考訳(メタデータ) (2021-10-07T00:54:03Z) - Distributed Deep Reinforcement Learning for Adaptive Medium Access and
Modulation in Shared Spectrum [42.54329256803276]
本研究では,非ライセンス共有スペクトルで動作する基地局の分散競合に基づく媒体アクセスについて検討する。
我々は,ネットワーク全体のダウンリンクスループットを最大化するために,競合と適応変調の両方のための学習に基づくアルゴリズムを考案した。
実証的に、政策勾配法によって蓄積された(比例的公正性)報酬は、ジェニーエイドによる適応エネルギー検出閾値よりも著しく高い。
論文 参考訳(メタデータ) (2021-09-24T03:33:45Z) - Optimal Power Allocation for Rate Splitting Communications with Deep
Reinforcement Learning [61.91604046990993]
このレターでは、レート分割多重アクセスネットワークにおいて、ユーザの電力割り当てを最適化するための新しいフレームワークを紹介します。
ネットワークでは、ユーザのために意図されたメッセージは、単一の共通部分と個々のプライベート部分に分割される。
論文 参考訳(メタデータ) (2021-07-01T06:32:49Z) - Federated Dynamic Spectrum Access [29.302039892247787]
動的スペクトラムアクセス(DSA)タスクのためのフェデレートラーニング(FL)ベースのフレームワークを提案する。
FLは、異種データ分散下でネットワーク端末のプライバシを保護できる分散機械学習フレームワークである。
論文 参考訳(メタデータ) (2021-06-28T20:49:41Z) - Cooperative Multi-Agent Reinforcement Learning Based Distributed Dynamic
Spectrum Access in Cognitive Radio Networks [46.723006378363785]
ダイナミックスペクトルアクセス(DSA)は、非効率的なスペクトル利用の問題を改善するための、有望なパラダイムである。
本稿では,一般的な認知無線ネットワークにおけるマルチユーザに対する分散DSA問題について検討する。
我々は、各認知ユーザに対する状態の部分的観測可能性に対処するために、DRQN(Deep Recurrent Q-network)を用いている。
論文 参考訳(メタデータ) (2021-06-17T06:52:21Z) - Decentralized Learning for Channel Allocation in IoT Networks over
Unlicensed Bandwidth as a Contextual Multi-player Multi-armed Bandit Game [134.88020946767404]
本稿では,プライマリセルネットワークにライセンスされたスペクトルに基づいて,アドホックなモノのインターネットネットワークにおける分散チャネル割り当て問題について検討する。
本研究では,この問題をコンテキスト型マルチプレイヤー・マルチアームバンディットゲームにマッピングし,試行錯誤による純粋に分散化された3段階ポリシー学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-30T10:05:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。