論文の概要: Reinforcement Learning-based Admission Control in Delay-sensitive
Service Systems
- arxiv url: http://arxiv.org/abs/2008.09590v1
- Date: Fri, 21 Aug 2020 17:33:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 21:20:47.379825
- Title: Reinforcement Learning-based Admission Control in Delay-sensitive
Service Systems
- Title(参考訳): 遅延感応サービスシステムにおける強化学習に基づく入場制御
- Authors: Majid Raeis, Ali Tizghadam and Alberto Leon-Garcia
- Abstract要約: 本稿では,サービスシステムのエンド・ツー・エンド遅延に対する確率的上界を保証する強化学習型入場制御器を提案する。
我々のコントローラは、ネットワークのキュー長情報を使用し、ネットワークトポロジやシステムパラメータに関する知識を必要としない。
- 参考スコア(独自算出の注目度): 10.089520556398574
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ensuring quality of service (QoS) guarantees in service systems is a
challenging task, particularly when the system is composed of more fine-grained
services, such as service function chains. An important QoS metric in service
systems is the end-to-end delay, which becomes even more important in
delay-sensitive applications, where the jobs must be completed within a time
deadline. Admission control is one way of providing end-to-end delay guarantee,
where the controller accepts a job only if it has a high probability of meeting
the deadline. In this paper, we propose a reinforcement learning-based
admission controller that guarantees a probabilistic upper-bound on the
end-to-end delay of the service system, while minimizes the probability of
unnecessary rejections. Our controller only uses the queue length information
of the network and requires no knowledge about the network topology or system
parameters. Since long-term performance metrics are of great importance in
service systems, we take an average-reward reinforcement learning approach,
which is well suited to infinite horizon problems. Our evaluations verify that
the proposed RL-based admission controller is capable of providing
probabilistic bounds on the end-to-end delay of the network, without using
system model information.
- Abstract(参考訳): サービスシステムの品質保証(QoS)を保証することは、特にサービスがサービス機能チェーンのようなよりきめ細かいサービスで構成されている場合、難しい作業です。
サービスシステムにおける重要なQoSメトリクスはエンドツーエンドの遅延であり、遅延に敏感なアプリケーションではさらに重要になる。
承認制御はエンドツーエンドの遅延保証を提供する方法の1つであり、期限に間に合う確率が高い場合に限り、コントローラがジョブを受理する。
本稿では,サービスシステムのエンド・ツー・エンド遅延の確率的上限を保証しつつ,不要な拒否の可能性を最小限に抑えながら,強化学習に基づく入場制御を提案する。
コントローラは,ネットワークのキュー長情報のみを使用し,ネットワークトポロジやシステムパラメータに関する知識を必要としない。
長期パフォーマンス指標はサービスシステムにおいて非常に重要であるため、無限の地平線問題によく適合する平均逆強化学習アプローチを採用する。
提案したRLベースの入出力制御器は,システムモデル情報を用いることなく,ネットワークの終端遅延に対する確率的境界を提供することができることを確認した。
関連論文リスト
- ReinWiFi: A Reinforcement-Learning-Based Framework for the Application-Layer QoS Optimization of WiFi Networks [6.566362478263619]
本稿では,無線ローカルエリアネットワーク(WLAN)のアプリケーション層品質を未知の干渉により最適化するために,強化学習に基づくスケジューリングフレームワークを提案する。
従来のスケジューリングパラメータと観測値から現在のスケジューリングアクションにマッピングするために、新しいQ-networkを訓練する。
論文 参考訳(メタデータ) (2024-05-06T14:44:06Z) - Secure Deep Reinforcement Learning for Dynamic Resource Allocation in
Wireless MEC Networks [46.689212344009015]
本稿では,モバイルエッジコンピューティングネットワークにおけるデータ管理とリソース割り当てのためのブロックチェーンセキュアな深層強化学習(BC-DRL)最適化フレームワークを提案する。
我々は、信頼性の高いブロックチェーン対応BSを選択するために、低レイテンシの評判に基づくRPoSコンセンサスプロトコルを設計する。
我々は、BC-DRLフレームワークが、ベンチマークブロックチェーンコンセンサスプロトコルやMECリソース割り当てアルゴリズムよりも高いセキュリティ、信頼性、リソース利用効率を達成することを検証するために、広範なシミュレーション結果と分析を提供する。
論文 参考訳(メタデータ) (2023-12-13T09:39:32Z) - Guaranteed Dynamic Scheduling of Ultra-Reliable Low-Latency Traffic via
Conformal Prediction [72.59079526765487]
アップリンクにおける超信頼性・低遅延トラフィック(URLLC)の動的スケジューリングは、既存のサービスの効率を大幅に向上させることができる。
主な課題は、URLLCパケット生成のプロセスにおける不確実性である。
本稿では,URLLC トラフィック予測器の品質に関わらず,信頼性と遅延を保証した新しい URLLC パケットスケジューラを提案する。
論文 参考訳(メタデータ) (2023-02-15T14:09:55Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - An Intelligent Deterministic Scheduling Method for Ultra-Low Latency
Communication in Edge Enabled Industrial Internet of Things [19.277349546331557]
時間知覚ネットワーク (TSN) は, 決定論的スケジューリングによる低遅延通信を実現するために最近研究されている。
非衝突理論に基づく決定論的スケジューリング (NDS) 法を提案し, 時間に敏感な流れに対する超低遅延通信を実現する。
実験の結果,NDS/DQSは決定論的超低レイテンシサービスを十分にサポートし,帯域幅の有効利用を保証できることがわかった。
論文 参考訳(メタデータ) (2022-07-17T16:52:51Z) - Networked Online Learning for Control of Safety-Critical
Resource-Constrained Systems based on Gaussian Processes [9.544146562919792]
本稿では,ガウス過程の回帰に基づく新しいネットワーク型オンライン学習手法を提案する。
本稿では,送信チャネルの帯域制限と時間遅延を考慮した,ローカルシステムとクラウド間の効率的なデータ伝送方式を提案する。
論文 参考訳(メタデータ) (2022-02-23T13:12:12Z) - Learning a Discrete Set of Optimal Allocation Rules in a Queueing System
with Unknown Service Rate [1.4094389874355762]
入場率とサービス率の不明なシステムの入場制御について検討する。
私たちのモデルでは、ジョブが到着するたびに、ディスペンサーがジョブを利用可能なサーバに割り当てるか、ブロックするかを決めます。
我々の目標は、ディスパッチの長期平均報酬を最大化するディスパッチポリシーを設計することです。
論文 参考訳(メタデータ) (2022-02-04T22:39:03Z) - Federated Learning with Correlated Data: Taming the Tail for Age-Optimal
Industrial IoT [55.62157530259969]
本稿では,ピークAoI要求に基づくセンサの送信電力最小化と待ち時間に対する確率的制約について検討する。
本稿では,センサのトレーニングデータ間の相関を考慮した局所モデル選択手法を提案する。
数値計算の結果,送信電力,ピークAoI,遅延尾部分布のトレードオフが示された。
論文 参考訳(メタデータ) (2021-08-17T08:38:31Z) - Delay-Tolerant Constrained OCO with Application to Network Resource
Allocation [44.67787270821051]
マルチスロットフィードバック遅延によるオンライン凸最適化(OCO)を検討します。
エージェントは、時間変動凸損失関数の蓄積を最小限に抑えるために、一連のオンライン決定を行う。
情報フィードバックと意思決定の更新の非同期性に取り組むために,二重正規化による新たな制約ペナルティを用いた遅延耐性制約OCOを提案する。
論文 参考訳(メタデータ) (2021-05-09T19:32:33Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z) - Queue-Learning: A Reinforcement Learning Approach for Providing Quality
of Service [1.8477401359673706]
servicerate controlは、サービスシステムにおける保証を提供する共通のメカニズムである。
本稿では,強化学習ベース(rlベース)サービスレートコントローラを提案する。
当社のコントローラは、システムのエンドツーエンドの遅延に関する明示的な確率的保証を提供します。
論文 参考訳(メタデータ) (2021-01-12T17:28:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。