論文の概要: Arrival Control in Quasi-Reversible Queueing Systems: Optimization and Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2505.16353v1
- Date: Thu, 22 May 2025 08:05:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.137196
- Title: Arrival Control in Quasi-Reversible Queueing Systems: Optimization and Reinforcement Learning
- Title(参考訳): 準可逆キューシステムにおける条件制御:最適化と強化学習
- Authors: Céline Comte, Pascal Moyal,
- Abstract要約: 本稿では,準可逆待ち行列システムの到着率を最適化するための多目的スキームを提案する。
準可逆性キューシステムにバランスの取れた到着制御ポリシを補足することで、準可逆性を維持できることを示す。
我々は、入場制御の問題に焦点を合わせ、最適化と強化学習の枠組みにおいて結果を活用する。
- 参考スコア(独自算出の注目度): 0.4143603294943439
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce a versatile scheme for optimizing the arrival rates of quasi-reversible queueing systems. We first propose an alternative definition of quasi-reversibility that encompasses reversibility and highlights the importance of the definition of customer classes. In a second time, we introduce balanced arrival control policies, which generalize the notion of balanced arrival rates introduced in the context of Whittle networks, to the much broader class of quasi-reversible queueing systems. We prove that supplementing a quasi-reversible queueing system with a balanced arrival-control policy preserves the quasi-reversibility, and we specify the form of the stationary measures. We revisit two canonical examples of quasi-reversible queueing systems, Whittle networks and order-independent queues. Lastly, we focus on the problem of admission control and leverage our results in the frameworks of optimization and reinforcement learning.
- Abstract(参考訳): 本稿では,準可逆待ち行列システムの到着率を最適化する多目的スキームを提案する。
まず、可逆性を包含する準可逆性の定義を提案し、顧客クラスの定義の重要性を強調した。
第2に、Whittleネットワークのコンテキストで導入された平衡到着率の概念を、より広範な準可逆キューシステムに一般化する、平衡到着制御ポリシーを導入する。
準可逆的キューシステムにバランスの取れた到着制御ポリシを補足することで、準可逆性を保ち、定常措置の形式を規定する。
準可逆キューシステム,Whittleネットワーク,順序非依存キューの2つの標準例を再検討する。
最後に,受入制御の問題に焦点をあて,最適化と強化学習の枠組みにおいて結果を活用する。
関連論文リスト
- Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Rethinking Resource Management in Edge Learning: A Joint Pre-training and Fine-tuning Design Paradigm [87.47506806135746]
一部のアプリケーションでは、エッジラーニングは、スクラッチから新しい2段階ラーニングへと焦点を移している。
本稿では,2段階のエッジ学習システムにおける共同コミュニケーションと計算資源管理の問題について考察する。
事前学習および微調整段階に対する共同資源管理の提案は,システム性能のトレードオフをうまくバランスさせることが示されている。
論文 参考訳(メタデータ) (2024-04-01T00:21:11Z) - Approximate Control for Continuous-Time POMDPs [35.26411026381803]
本研究では、離散状態とアクション空間を持つ連続的に部分的に観測可能なシステムの意思決定フレームワークを提案する。
フィルタと制御問題に対して近似法を用い, 増大する状態によく対応している。
本稿では,キューシステムや化学反応ネットワークなど,いくつかの部分的に観測されたシステムに対して,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-02-02T14:20:04Z) - The Transient Cost of Learning in Queueing Systems [4.257386020315728]
キューシステムは、通信ネットワーク、医療、サービスシステムなどにおけるユースケースを備えた、広く適用可能なモデルです。
本稿では、パラメータの不確実性に起因する平均待ち時間長の最大増加を定量化するために、キューにおける学習の過渡コスト(TCLQ)を提案する。
そこで本研究では,Lyapunov と Bandit 分析を橋渡しし,幅広いアルゴリズムの保証を提供し,独立性のある TCLQ の統一解析フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-15T14:50:12Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z) - Tailored Learning-Based Scheduling for Kubernetes-Oriented Edge-Cloud
System [54.588242387136376]
エッジクラウドシステムのための学習ベースのスケジューリングフレームワークkaisを紹介する。
まず,分散した要求ディスパッチに対応するために,協調型マルチエージェントアクタ-クリティックアルゴリズムを設計する。
次に,多種多様なシステムスケールと構造について,グラフニューラルネットワークを用いてシステム状態情報を埋め込む。
第3に、リクエストディスパッチとサービスオーケストレーションを調和させる2段階のスケジューリングメカニズムを採用します。
論文 参考訳(メタデータ) (2021-01-17T03:45:25Z) - Queue-Learning: A Reinforcement Learning Approach for Providing Quality
of Service [1.8477401359673706]
servicerate controlは、サービスシステムにおける保証を提供する共通のメカニズムである。
本稿では,強化学習ベース(rlベース)サービスレートコントローラを提案する。
当社のコントローラは、システムのエンドツーエンドの遅延に関する明示的な確率的保証を提供します。
論文 参考訳(メタデータ) (2021-01-12T17:28:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。