論文の概要: Bayesian Nonparametric Modelling for Model-Free Reinforcement Learning
in LTE-LAA and Wi-Fi Coexistence
- arxiv url: http://arxiv.org/abs/2107.02431v1
- Date: Tue, 6 Jul 2021 07:11:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-07 23:17:49.937920
- Title: Bayesian Nonparametric Modelling for Model-Free Reinforcement Learning
in LTE-LAA and Wi-Fi Coexistence
- Title(参考訳): LTE-LAAとWi-Fi共存におけるモデルフリー強化学習のためのベイズ非パラメトリックモデリング
- Authors: Po-Kan Shih, Bahman Moraffah
- Abstract要約: この研究は、Wi-FiとLTEライセンスアクセス(LTE-LAA)エージェントの5GHz帯の共存に対処する非パラメトリックベイズ強化学習アルゴリズムを特徴とする。
報酬関数に公正度尺度を導入し、エージェント間の公平な共有を促進する。
- 参考スコア(独自算出の注目度): 2.8427946758947304
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the arrival of next generation wireless communication, a growing number
of new applications like internet of things, autonomous driving systems, and
drone are crowding the unlicensed spectrum. Licensed network such as the
long-term evolution (LTE) also comes to the unlicensed spectrum for better
providing high-capacity contents with low cost. However, LTE was not designed
to share resources with others. Previous solutions usually work on fixed
scenarios. This work features a Nonparametric Bayesian reinforcement learning
algorithm to cope with the coexistence between Wi-Fi and LTE licensed assisted
access (LTE-LAA) agents in 5 GHz unlicensed spectrum. The coexistence problem
is modeled as a decentralized partially-observable Markov decision process
(Dec-POMDP) and Bayesian inference is adopted for policy learning with
nonparametric prior to accommodate the uncertainty of policy for different
agents. A fairness measure is introduced in the reward function to encourage
fair sharing between agents. Variational inference for posterior model
approximation is considered to make the algorithm computationally efficient.
Simulation results demonstrate that this algorithm can reach high value with
compact policy representations in few learning iterations.
- Abstract(参考訳): 次世代無線通信の登場により、モノのインターネット、自動運転システム、ドローンといった新しいアプリケーションが、ライセンスされていない領域に群がっている。
長期進化(LTE)のようなライセンスネットワークは、低コストで高容量のコンテンツを提供するために、ライセンスされていないスペクトルにもたらされる。
しかし、LTEはリソースを他人と共有するように設計されていない。
従来のソリューションは通常、固定シナリオで動作する。
この研究は、Wi-FiとLTEライセンスアクセス(LTE-LAA)エージェントの5GHz帯の共存に対処する非パラメトリックベイズ強化学習アルゴリズムを特徴とする。
共存問題は分散部分観測可能なマルコフ決定過程(dec-pomdp)としてモデル化され、異なるエージェントに対する政策の不確実性に対応するために、非パラメトリックな政策学習にベイズ推論が採用される。
報酬関数に公正度尺度を導入し、エージェント間の公平な共有を促進する。
後続モデル近似の変分推論はアルゴリズムを計算効率良くすると考えられる。
シミュレーションの結果、このアルゴリズムは、少ない学習イテレーションで、コンパクトなポリシー表現で高い値に達することが示されている。
関連論文リスト
- Adaptive Federated Pruning in Hierarchical Wireless Networks [69.6417645730093]
Federated Learning(FL)は、サーバがプライベートデータセットにアクセスすることなく、複数のデバイスによって更新されたモデルを集約する、プライバシ保護の分散学習フレームワークである。
本稿では,無線ネットワークにおけるHFLのモデルプルーニングを導入し,ニューラルネットワークの規模を小さくする。
提案するHFLは,モデルプルーニングを伴わないHFLと比較して学習精度が良く,通信コストが約50%削減できることを示す。
論文 参考訳(メタデータ) (2023-05-15T22:04:49Z) - Predictive GAN-powered Multi-Objective Optimization for Hybrid Federated
Split Learning [56.125720497163684]
無線ネットワークにおけるハイブリッド・フェデレーション・スプリット・ラーニング・フレームワークを提案する。
ラベル共有のないモデル分割のための並列計算方式を設計し,提案方式が収束速度に与える影響を理論的に解析する。
論文 参考訳(メタデータ) (2022-09-02T10:29:56Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - Distributed Deep Reinforcement Learning for Adaptive Medium Access and
Modulation in Shared Spectrum [42.54329256803276]
本研究では,非ライセンス共有スペクトルで動作する基地局の分散競合に基づく媒体アクセスについて検討する。
我々は,ネットワーク全体のダウンリンクスループットを最大化するために,競合と適応変調の両方のための学習に基づくアルゴリズムを考案した。
実証的に、政策勾配法によって蓄積された(比例的公正性)報酬は、ジェニーエイドによる適応エネルギー検出閾値よりも著しく高い。
論文 参考訳(メタデータ) (2021-09-24T03:33:45Z) - Cooperative Multi-Agent Reinforcement Learning Based Distributed Dynamic
Spectrum Access in Cognitive Radio Networks [46.723006378363785]
ダイナミックスペクトルアクセス(DSA)は、非効率的なスペクトル利用の問題を改善するための、有望なパラダイムである。
本稿では,一般的な認知無線ネットワークにおけるマルチユーザに対する分散DSA問題について検討する。
我々は、各認知ユーザに対する状態の部分的観測可能性に対処するために、DRQN(Deep Recurrent Q-network)を用いている。
論文 参考訳(メタデータ) (2021-06-17T06:52:21Z) - Bayesian Nonparametric Reinforcement Learning in LTE and Wi-Fi
Coexistence [0.0]
5GHz帯でWi-FiとLTEエージェントの共存に対処する強化学習アルゴリズムを提案する。
報酬関数に公正度尺度を導入し、エージェント間の公平な共有を奨励した。
論文 参考訳(メタデータ) (2021-05-25T22:40:44Z) - Edge Federated Learning Via Unit-Modulus Over-The-Air Computation
(Extended Version) [64.76619508293966]
本稿では,効率の良いエッジフェデレーション学習を実現するために,UM-AirCompフレームワークを提案する。
ローカルモデルパラメータを同時にアップロードし、アナログビームフォーミングを通じてグローバルモデルパラメータを更新する。
車両間自動運転シミュレーションプラットフォームにおけるUM-AirCompの実装を実演する。
論文 参考訳(メタデータ) (2021-01-28T15:10:22Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z) - Learning Centric Power Allocation for Edge Intelligence [84.16832516799289]
分散データを収集し、エッジで機械学習を実行するエッジインテリジェンスが提案されている。
本稿では,経験的分類誤差モデルに基づいて無線リソースを割り当てるLCPA法を提案する。
実験の結果,提案したLCPAアルゴリズムは,他のパワーアロケーションアルゴリズムよりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-21T07:02:07Z) - Machine Learning enabled Spectrum Sharing in Dense LTE-U/Wi-Fi
Coexistence Scenarios [10.228746210951533]
LTE-Unlicensed (LTE-U) 仕様に注目する。
Wi-Fiパケットを復号化せずに、Wi-Fiの基本サービス集合の数をリアルタイムで検出することは難しい問題である。
本稿では,LTE-U OFF期間中に観測されたエネルギー値を用いて,MLに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-18T01:26:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。