論文の概要: Bayesian Nonparametric Reinforcement Learning in LTE and Wi-Fi
Coexistence
- arxiv url: http://arxiv.org/abs/2105.12249v1
- Date: Tue, 25 May 2021 22:40:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 13:15:05.466667
- Title: Bayesian Nonparametric Reinforcement Learning in LTE and Wi-Fi
Coexistence
- Title(参考訳): LTEとWi-Fi共存におけるベイズ非パラメトリック強化学習
- Authors: Po-Kan Shih
- Abstract要約: 5GHz帯帯のWi-FiエージェントとLTE-LAAエージェントの共存に対処するための強化学習アルゴリズムを提案する。
報酬関数に公正度尺度を導入し、エージェント間の公平な共有を奨励した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the formation of next generation wireless communication, a growing
number of new applications like internet of things, autonomous car, and drone
is crowding the unlicensed spectrum. Licensed network such as LTE also comes to
the unlicensed spectrum for better providing high-capacity contents with low
cost. However, LTE was not designed for sharing spectrum with others. A
cooperation center for these networks is costly because they possess
heterogeneous properties and everyone can enter and leave the spectrum
unrestrictedly, so the design will be challenging. Since it is infeasible to
incorporate potentially infinite scenarios with one unified design, an
alternative solution is to let each network learn its own coexistence policy.
Previous solutions only work on fixed scenarios. In this work a reinforcement
learning algorithm is presented to cope with the coexistence between Wi-Fi and
LTE-LAA agents in 5 GHz unlicensed spectrum. The coexistence problem was
modeled as a Dec-POMDP and Bayesian approach was adopted for policy learning
with nonparametric prior to accommodate the uncertainty of policy for different
agents. A fairness measure was introduced in the reward function to encourage
fair sharing between agents. The reinforcement learning was turned into an
optimization problem by transforming the value function as likelihood and
variational inference for posterior approximation. Simulation results
demonstrate that this algorithm can reach high value with compact policy
representations, and stay computationally efficient when applying to agent set.
- Abstract(参考訳): 次世代のワイヤレス通信の形成に伴い、モノのインターネット、自動運転車、ドローンといった新しいアプリケーションが、無許可の帯域を混雑させている。
LTEのようなライセンス付きネットワークも、高容量のコンテンツを低コストで提供するために、未ライセンスの帯域で提供される。
しかし、LTEは他とスペクトルを共有するように設計されていない。
これらのネットワークのための協力センターは、不均一な特性を持ち、誰もが自由にスペクトルを入力・離脱できるため、設計は困難である。
一つの統一設計で無限のシナリオを組み込むことは不可能であるため、別の解決策は各ネットワークに自身の共存ポリシーを学習させることである。
以前のソリューションは固定シナリオでのみ動作する。
本研究では,Wi-Fi と LTE-LAA エージェントの5GHz 帯における共存に対処する強化学習アルゴリズムを提案する。
共存問題はDec-POMDPとしてモデル化され、異なるエージェントの政策の不確実性に対応するために、非パラメトリックの政策学習にベイズ的アプローチが採用された。
報酬関数に公正度尺度を導入し、エージェント間の公平な共有を奨励した。
後部近似の確率および変分推論として値関数を変換することにより,強化学習を最適化問題とした。
シミュレーションの結果、このアルゴリズムはコンパクトなポリシー表現で高い値に達し、エージェントセットに適用しても計算効率が保たれることが示された。
関連論文リスト
- Adaptive Federated Pruning in Hierarchical Wireless Networks [69.6417645730093]
Federated Learning(FL)は、サーバがプライベートデータセットにアクセスすることなく、複数のデバイスによって更新されたモデルを集約する、プライバシ保護の分散学習フレームワークである。
本稿では,無線ネットワークにおけるHFLのモデルプルーニングを導入し,ニューラルネットワークの規模を小さくする。
提案するHFLは,モデルプルーニングを伴わないHFLと比較して学習精度が良く,通信コストが約50%削減できることを示す。
論文 参考訳(メタデータ) (2023-05-15T22:04:49Z) - Scalable Hierarchical Over-the-Air Federated Learning [3.8798345704175534]
この研究は、干渉とデバイスデータの不均一性の両方を扱うために設計された新しい2段階学習手法を導入する。
本稿では,提案アルゴリズムの収束を導出するための包括的数学的アプローチを提案する。
干渉とデータの不均一性にもかかわらず、提案アルゴリズムは様々なパラメータに対して高い学習精度を実現する。
論文 参考訳(メタデータ) (2022-11-29T12:46:37Z) - Predictive GAN-powered Multi-Objective Optimization for Hybrid Federated
Split Learning [56.125720497163684]
無線ネットワークにおけるハイブリッド・フェデレーション・スプリット・ラーニング・フレームワークを提案する。
ラベル共有のないモデル分割のための並列計算方式を設計し,提案方式が収束速度に与える影響を理論的に解析する。
論文 参考訳(メタデータ) (2022-09-02T10:29:56Z) - Learning Resilient Radio Resource Management Policies with Graph Neural
Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。
有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。
このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文 参考訳(メタデータ) (2022-03-07T19:40:39Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - Boosting Federated Learning in Resource-Constrained Networks [1.7010199949406575]
フェデレートラーニング(FL)は、一連のクライアントデバイスが、生データを共有せずに協調的にモデルをトレーニングすることを可能にする。
推測学習アルゴリズムであるGeLを提案する。
資源制約ネットワークにおいて,GeLは経験的収束を最大40%向上させることができることを示す。
論文 参考訳(メタデータ) (2021-10-21T21:23:04Z) - Bayesian Nonparametric Modelling for Model-Free Reinforcement Learning
in LTE-LAA and Wi-Fi Coexistence [2.8427946758947304]
この研究は、Wi-FiとLTEライセンスアクセス(LTE-LAA)エージェントの5GHz帯の共存に対処する非パラメトリックベイズ強化学習アルゴリズムを特徴とする。
報酬関数に公正度尺度を導入し、エージェント間の公平な共有を促進する。
論文 参考訳(メタデータ) (2021-07-06T07:11:34Z) - Low-Latency Federated Learning over Wireless Channels with Differential
Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。
本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文 参考訳(メタデータ) (2021-06-20T13:51:18Z) - Cooperative Multi-Agent Reinforcement Learning Based Distributed Dynamic
Spectrum Access in Cognitive Radio Networks [46.723006378363785]
ダイナミックスペクトルアクセス(DSA)は、非効率的なスペクトル利用の問題を改善するための、有望なパラダイムである。
本稿では,一般的な認知無線ネットワークにおけるマルチユーザに対する分散DSA問題について検討する。
我々は、各認知ユーザに対する状態の部分的観測可能性に対処するために、DRQN(Deep Recurrent Q-network)を用いている。
論文 参考訳(メタデータ) (2021-06-17T06:52:21Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。