Fugu-MT 論文翻訳(概要): Reinforcement learning for Admission Control in 5G Wireless Networks

論文の概要: Reinforcement learning for Admission Control in 5G Wireless Networks

arxiv url: http://arxiv.org/abs/2104.10761v1
Date: Tue, 13 Apr 2021 06:37:18 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-04 08:03:49.493402
Title: Reinforcement learning for Admission Control in 5G Wireless Networks
Title（参考訳）: 5G無線ネットワークにおけるアドミッション制御のための強化学習
Authors: Youri Raaijmakers and Silvio Mandelli and Mark Doll
Abstract要約: 無線ネットワークにおける加入制御の重要な課題は、新しい要求のブロック確率と進行中の要求の低下確率の間の最適なトレードオフを課すことである。入場制御問題を解くための2つのアプローチを考察する:i) 一般的に採用されているしきい値ポリシーとi) ニューラルネットワークによる強化学習に依存する政策を提案する。
参考スコア（独自算出の注目度）: 3.2345600015792564
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The key challenge in admission control in wireless networks is to strike an optimal trade-off between the blocking probability for new requests while minimizing the dropping probability of ongoing requests. We consider two approaches for solving the admission control problem: i) the typically adopted threshold policy and ii) our proposed policy relying on reinforcement learning with neural networks. Extensive simulation experiments are conducted to analyze the performance of both policies. The results show that the reinforcement learning policy outperforms the threshold-based policies in the scenario with heterogeneous time-varying arrival rates and multiple user equipment types, proving its applicability in realistic wireless network scenarios.
Abstract（参考訳）: 無線ネットワークにおける加入制御の鍵となる課題は、新たな要求のブロック確率と、進行中の要求の低下確率を最小化することである。入場制御問題を解くための2つのアプローチを考察する:i) 一般的に採用されているしきい値ポリシーとi) ニューラルネットワークによる強化学習に依存する政策を提案する。両ポリシーの性能を解析するために,広範なシミュレーション実験を行った。その結果、強化学習政策は、不均一な時間変化の到着率と複数のユーザ機器タイプでシナリオにおけるしきい値ベースのポリシーよりも優れており、現実的な無線ネットワークシナリオに適用可能であることが示された。

関連論文リスト

Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [86.99017195607077]
無線ネットワークにおける自己回帰的マルコフ音源のリアルタイムサンプリングと推定について検討する。政策最適化のためのグラフィカル強化学習フレームワークを提案する。理論的には、提案したポリシーは転送可能であり、あるグラフ上で訓練されたポリシーを構造的に類似したグラフに効果的に適用することができる。
論文参考訳（メタデータ） (2026-01-19T02:18:45Z)
One-Step Flow Policy Mirror Descent [52.31612487608593]
Flow Policy Mirror Descent (FPMD)は、フローポリシー推論中の1ステップのサンプリングを可能にするオンラインRLアルゴリズムである。本手法は, 直流整合モデルにおける単段サンプリングの分散分散と離散化誤差の理論的関係を利用する。
論文参考訳（メタデータ） (2025-07-31T15:51:10Z)
Differentiable Discrete Event Simulation for Queuing Network Control [7.965453961211742]
キューのネットワーク制御は、高い性、大きな状態とアクション空間、安定性の欠如など、異なる課題を生んでいる。本稿では,異なる離散イベントシミュレーションに基づくポリシー最適化のためのスケーラブルなフレームワークを提案する。本手法は,非定常環境で動作するシステムなど,現実的なシナリオを柔軟に処理することができる。
論文参考訳（メタデータ） (2024-09-05T17:53:54Z)
Intervention-Assisted Policy Gradient Methods for Online Stochastic Queuing Network Optimization: Technical Report [1.4201040196058878]
本研究は,従来の深層強化学習法に代わるオンライン深層強化学習制御(ODRLC)を提案する。 ODRLCはオンラインインタラクションを使用してキューイングネットワーク(SQN)の最適制御ポリシーを学習する本稿では、ネットワークの安定性を確保するために、これらの介入支援ポリシーを設計する手法を提案する。
論文参考訳（メタデータ） (2024-04-05T14:02:04Z)
Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文参考訳（メタデータ） (2024-04-04T06:24:11Z)
Closed-form congestion control via deep symbolic regression [1.5961908901525192]
強化学習(RL)アルゴリズムは、超低レイテンシおよび高スループットシナリオにおける課題を処理することができる。実際のデプロイメントにおけるニューラルネットワークモデルの採用は、リアルタイムの推論と解釈可能性に関して、依然としていくつかの課題を提起している。本稿では,性能と一般化能力を維持しつつ,このような課題に対処する方法論を提案する。
論文参考訳（メタデータ） (2024-03-28T14:31:37Z)
Probabilistic Reach-Avoid for Bayesian Neural Networks [71.67052234622781]
最適合成アルゴリズムは、証明された状態の数を4倍以上に増やすことができることを示す。このアルゴリズムは、平均的な到達回避確率を3倍以上に向上させることができる。
論文参考訳（メタデータ） (2023-10-03T10:52:21Z)
Statistically Efficient Variance Reduction with Double Policy Estimation for Off-Policy Evaluation in Sequence-Modeled Reinforcement Learning [53.97273491846883]
本稿では、オフラインシーケンスモデリングとオフライン強化学習をダブルポリシー推定と組み合わせたRLアルゴリズムDPEを提案する。 D4RLベンチマークを用いて,OpenAI Gymの複数のタスクで本手法を検証した。
論文参考訳（メタデータ） (2023-08-28T20:46:07Z)
A State-Augmented Approach for Learning Optimal Resource Management Decisions in Wireless Networks [58.720142291102135]
マルチユーザ無線ネットワークにおける無線リソース管理(RRM)問題について考察する。目標は、ユーザのエルゴード平均パフォーマンスに制約を受けるネットワーク全体のユーティリティ機能を最適化することである。本稿では, RRM の制約に対応する2変数の集合を入力として, 瞬時ネットワーク状態と並行して, RRM のパラメータ化を提案する。
論文参考訳（メタデータ） (2022-10-28T21:24:13Z)
Mitigating Off-Policy Bias in Actor-Critic Methods with One-Step Q-learning: A Novel Correction Approach [0.0]
我々は,このような不一致が継続的制御に与える影響を軽減するために,新しい政策類似度尺度を導入する。本手法は、決定論的政策ネットワークに適用可能な、適切な単一ステップのオフ・ポリシー補正を提供する。
論文参考訳（メタデータ） (2022-08-01T11:33:12Z)
Learning Resilient Radio Resource Management Policies with Graph Neural Networks [124.89036526192268]
我々は、ユーザ当たりの最小容量制約でレジリエントな無線リソース管理問題を定式化する。有限個のパラメータ集合を用いてユーザ選択と電力制御ポリシーをパラメータ化できることを示す。このような適応により,提案手法は平均レートと5番目のパーセンタイルレートとの良好なトレードオフを実現する。
論文参考訳（メタデータ） (2022-03-07T19:40:39Z)
Offline Contextual Bandits for Wireless Network Optimization [107.24086150482843]
本稿では,ユーザ要求の変化に応じて,ネットワーク内の各セルの構成パラメータを自動的に調整するポリシの学習方法について検討する。私たちのソリューションは、オフライン学習のための既存の方法を組み合わせて、この文脈で生じる重要な課題を克服する原則的な方法でそれらを適応します。
論文参考訳（メタデータ） (2021-11-11T11:31:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。