論文の概要: Deep Reinforcement Learning for URLLC data management on top of
scheduled eMBB traffic
- arxiv url: http://arxiv.org/abs/2103.01801v1
- Date: Tue, 2 Mar 2021 15:22:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 15:49:49.649777
- Title: Deep Reinforcement Learning for URLLC data management on top of
scheduled eMBB traffic
- Title(参考訳): スケジュール付きeMBBトラフィックを用いたURLLCデータ管理のための深層強化学習
- Authors: Fabio Saggese, Luca Pasqualini, Marco Moretti, and Andrea Abrardo
- Abstract要約: 超信頼性低遅延通信(URLLC)と拡張モバイルブロードバンド(eMBB)トラフィック間で利用可能な物理層リソースをスライスするための深層強化学習アルゴリズムを提案します。
DRLエージェントは、最新のDRLアルゴリズムであるポリシー最適化(PPO)を使用して、eMBBコードワードを句読し、着信URLLCトラフィックを動的に割り当てるように訓練します。
DRLエージェントによって考案されたポリシーは、URLLCトラフィックの遅延要求に決して違反せず、同時に、eMBBコードワードの数が停止状態に維持されていることを示す。
- 参考スコア(独自算出の注目度): 11.322080722788971
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the advent of 5G and the research into beyond 5G (B5G) networks, a novel
and very relevant research issue is how to manage the coexistence of different
types of traffic, each with very stringent but completely different
requirements. In this paper we propose a deep reinforcement learning (DRL)
algorithm to slice the available physical layer resources between
ultra-reliable low-latency communications (URLLC) and enhanced Mobile BroadBand
(eMBB) traffic. Specifically, in our setting the time-frequency resource grid
is fully occupied by eMBB traffic and we train the DRL agent to employ proximal
policy optimization (PPO), a state-of-the-art DRL algorithm, to dynamically
allocate the incoming URLLC traffic by puncturing eMBB codewords. Assuming that
each eMBB codeword can tolerate a certain limited amount of puncturing beyond
which is in outage, we show that the policy devised by the DRL agent never
violates the latency requirement of URLLC traffic and, at the same time,
manages to keep the number of eMBB codewords in outage at minimum levels, when
compared to other state-of-the-art schemes.
- Abstract(参考訳): 5Gの出現と5G(B5G)ネットワークを超えての研究により、新しい非常に関連性の高い研究課題は、異なる種類のトラフィックの共存を管理する方法です。
本稿では,高信頼低遅延通信 (URLLC) と拡張モバイルブロードバンド (eMBB) トラフィック間で利用可能な物理層資源をスライスする深層強化学習 (DRL) アルゴリズムを提案する。
具体的には、時間周波数リソースグリッドをeMBBトラフィックで完全に占有し、最新のDRLアルゴリズムである近位ポリシー最適化(PPO)を採用するようDRLエージェントを訓練し、eMBBコードワードを句読して着信URLLCトラフィックを動的に割り当てます。
各eMBBコードワードが停止している以上の一定の限られた量の句読点を許容できると仮定すると、DRLエージェントによって考案されたポリシーがURLLCトラフィックのレイテンシ要件に違反しないことを示し、同時に、他の最先端のスキームと比較して、eMBBコードワードの数を最小限のレベルで停止に保つことを管理しています。
関連論文リスト
- Real-time Traffic Classification for 5G NSA Encrypted Data Flows With
Physical Channel Records [3.8998980344852856]
第5世代New-Radio(5G-NR)モバイルネットワークトラフィックの分類は、通信分野における新たな話題である。
Deep Packet Inspection (DPI)のような従来のアプローチは、暗号化されたデータフローに直接適用することはできない。
本研究では,物理チャネルレコードを用いたリアルタイム暗号化された5Gノンスタンダローン(NSA)アプリケーションレベルのトラフィック分類について検討する。
論文 参考訳(メタデータ) (2023-07-15T09:32:34Z) - A Novel Multi-Agent Deep RL Approach for Traffic Signal Control [13.927155702352131]
都市ネットワークにおける複数の交通信号制御のための Friend-Deep Q-network (Friend-DQN) アプローチを提案する。
特に、複数のエージェント間の協調は状態-作用空間を減少させ、収束を加速させる。
論文 参考訳(メタデータ) (2023-06-05T08:20:37Z) - Sparsity-Aware Intelligent Massive Random Access Control in Open RAN: A
Reinforcement Learning Based Approach [61.74489383629319]
新たなOpen Radio Access Network(O-RAN)におけるデバイスの大量ランダムアクセスは、アクセス制御と管理に大きな課題をもたらします。
閉ループアクセス制御の強化学習(RL)支援方式を提案する。
深部RL支援SAUDは、連続的かつ高次元の状態と行動空間を持つ複雑な環境を解決するために提案されている。
論文 参考訳(メタデータ) (2023-03-05T12:25:49Z) - Guaranteed Dynamic Scheduling of Ultra-Reliable Low-Latency Traffic via
Conformal Prediction [72.59079526765487]
アップリンクにおける超信頼性・低遅延トラフィック(URLLC)の動的スケジューリングは、既存のサービスの効率を大幅に向上させることができる。
主な課題は、URLLCパケット生成のプロセスにおける不確実性である。
本稿では,URLLC トラフィック予測器の品質に関わらず,信頼性と遅延を保証した新しい URLLC パケットスケジューラを提案する。
論文 参考訳(メタデータ) (2023-02-15T14:09:55Z) - Distributed-Training-and-Execution Multi-Agent Reinforcement Learning
for Power Control in HetNet [48.96004919910818]
We propose a multi-agent Deep reinforcement learning (MADRL) based power control scheme for the HetNet。
エージェント間の協調を促進するために,MADRLシステムのためのペナルティベースQラーニング(PQL)アルゴリズムを開発した。
このように、エージェントのポリシーは、他のエージェントによってより容易に学習でき、より効率的なコラボレーションプロセスをもたらす。
論文 参考訳(メタデータ) (2022-12-15T17:01:56Z) - Decentralized Federated Reinforcement Learning for User-Centric Dynamic
TFDD Control [37.54493447920386]
非対称かつ不均一なトラフィック要求を満たすための学習に基づく動的時間周波数分割二重化(D-TFDD)方式を提案する。
分散化された部分観測可能なマルコフ決定過程(Dec-POMDP)として問題を定式化する。
本稿では,グローバルリソースを分散的に最適化するために,Wolpertinger Deep Deterministic Policy gradient (FWDDPG)アルゴリズムという,連合強化学習(RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-04T07:39:21Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Area-wide traffic signal control based on a deep graph Q-Network (DGQN)
trained in an asynchronous manner [3.655021726150368]
強化学習(RL)アルゴリズムは交通信号研究に広く応用されている。
しかし,大規模交通ネットワークにおける信号機の共同制御にはいくつかの問題がある。
論文 参考訳(メタデータ) (2020-08-05T06:13:58Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。