論文の概要: OptScaler: A Hybrid Proactive-Reactive Framework for Robust Autoscaling
in the Cloud
- arxiv url: http://arxiv.org/abs/2311.12864v1
- Date: Thu, 26 Oct 2023 04:38:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-27 00:21:27.008410
- Title: OptScaler: A Hybrid Proactive-Reactive Framework for Robust Autoscaling
in the Cloud
- Title(参考訳): OptScaler: クラウドにおけるロバスト自動スケーリングのためのハイブリッドなProactive-Reactiveフレームワーク
- Authors: Ding Zou, Wei Lu, Zhibo Zhu, Xingyu Lu, Jun Zhou, Xiaojin Wang, Kangyu
Liu, Haiqing Wang, Kefan Wang, Renen Sun
- Abstract要約: オートスケーリングはクラウドコンピューティングにおいて重要なメカニズムであり、動的ワークロード下でのコンピューティングリソースの自律的な調整をサポートする。
既存のアクティブ自動スケーリングメソッドは将来のワークロードを予測し、事前にリソースをスケールしますが、リアクティブメソッドはリアルタイムシステムフィードバックに依存します。
本稿では,CPU利用制御のためのプロアクティブ手法とリアクティブ手法の両方のパワーを統合するハイブリッド自動スケーリングフレームワークであるOpsScalerを提案する。
- 参考スコア(独自算出の注目度): 11.340252931723063
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autoscaling is a vital mechanism in cloud computing that supports the
autonomous adjustment of computing resources under dynamic workloads. A primary
goal of autoscaling is to stabilize resource utilization at a desirable level,
thus reconciling the need for resource-saving with the satisfaction of Service
Level Objectives (SLOs). Existing proactive autoscaling methods anticipate the
future workload and scale the resources in advance, whereas the reliability may
suffer from prediction deviations arising from the frequent fluctuations and
noise of cloud workloads; reactive methods rely on real-time system feedback,
while the hysteretic nature of reactive methods could cause violations of the
rigorous SLOs. To this end, this paper presents OptScaler, a hybrid autoscaling
framework that integrates the power of both proactive and reactive methods for
regulating CPU utilization. Specifically, the proactive module of OptScaler
consists of a sophisticated workload prediction model and an optimization
model, where the former provides reliable inputs to the latter for making
optimal scaling decisions. The reactive module provides a self-tuning estimator
of CPU utilization to the optimization model. We embed Model Predictive Control
(MPC) mechanism and robust optimization techniques into the optimization model
to further enhance its reliability. Numerical results have demonstrated the
superiority of both the workload prediction model and the hybrid framework of
OptScaler in the scenario of online services compared to prevalent reactive,
proactive, or hybrid autoscalers. OptScaler has been successfully deployed at
Alipay, supporting the autoscaling of applets in the world-leading payment
platform.
- Abstract(参考訳): オートスケーリングはクラウドコンピューティングにおいて重要なメカニズムであり、動的ワークロード下でのコンピューティングリソースの自律的な調整をサポートする。
自動スケーリングの主な目的は、望ましいレベルでリソース利用を安定させることであり、サービスレベル目標(slos)の満足度とリソース節約の必要性を調和させることである。
既存のアクティブ自動スケーリング手法は将来のワークロードを予測し、事前にリソースをスケールするが、信頼性はクラウドワークロードの頻繁な変動とノイズに起因する予測偏差に悩まされる可能性がある。
そこで本稿では,cpu使用率を調節するproactiveとreactiveの両方の方法を統合するハイブリッドオートスケーリングフレームワーク optscaler を提案する。
具体的には、 optscaler の proactive module は高度なワークロード予測モデルと最適化モデルで構成されており、前者は最適なスケーリング決定を行うために後者に信頼できる入力を提供する。
リアクティブモジュールは最適化モデルにCPU利用の自己チューニング推定器を提供する。
モデル予測制御(mpc)機構とロバスト最適化手法を最適化モデルに組み込んで信頼性をさらに向上させる。
オンラインサービスのシナリオにおいて、ワークロード予測モデルとOptScalerのハイブリッドフレームワークの両方が、一般的なリアクティブ、プロアクティブ、ハイブリッドオートスケーラと比較して優れていることを示す。
OptScalerはAlipayにデプロイされ、世界リードの支払いプラットフォームにおけるアプレットの自動スケーリングをサポートする。
関連論文リスト
- Modular Framework for Uncertainty Prediction in Autonomous Vehicle Motion Forecasting within Complex Traffic Scenarios [6.6603214802161546]
我々のフレームワークは、フレキシブルでエンドツーエンドの差別化可能なエンコーダ-デコーダアーキテクチャを採用している。
主な貢献は、動的予測のためにコンテキスト対応の占有グリッドを生成する確率的ヒートマップ予測器である。
エンドツーエンドのベースラインに対してベンチマークを行い、より高速な収束、安定性の向上、柔軟性を示しています。
論文 参考訳(メタデータ) (2025-01-27T20:21:18Z) - Optimizing Small Language Models for In-Vehicle Function-Calling [4.148443557388842]
本稿では,小型言語モデル(SLM)をエッジデバイスとして車両内の機能呼び出しエージェントとして展開するための総合的アプローチを提案する。
SLMを利用することで、車両制御機構を簡素化し、ユーザエクスペリエンスを向上させる。
論文 参考訳(メタデータ) (2025-01-04T17:32:56Z) - Microservices-Based Framework for Predictive Analytics and Real-time Performance Enhancement in Travel Reservation Systems [1.03590082373586]
本稿では,リアルタイム旅行予約システムの性能向上を目的としたアーキテクチャの枠組みを提案する。
私たちのフレームワークには、顧客の需要予測を最適化する機械学習モデルによるリアルタイム予測分析、動的価格設定、システムパフォーマンスが含まれています。
今後は、高度なAIモデルとエッジ処理を調査して、採用するシステムのパフォーマンスと堅牢性をさらに向上する予定である。
論文 参考訳(メタデータ) (2024-12-20T07:19:42Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - Model-based Causal Bayesian Optimization [74.78486244786083]
乗算重み付き因果ベイズ最適化のための最初のアルゴリズム(CBO-MW)を提案する。
グラフ関連の量に自然に依存するCBO-MWに対する後悔の限界を導出する。
我々の実験は、共有モビリティシステムにおいて、ユーザの需要パターンを学習するためにCBO-MWをどのように使用できるかの現実的なデモを含む。
論文 参考訳(メタデータ) (2023-07-31T13:02:36Z) - MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and
Guided Intention Querying [110.83590008788745]
自律運転システムにとって、複雑な運転シナリオを理解し、情報的な決定を下すためには、動きの予測が不可欠である。
本稿では,これらの課題に対処するためのMotion TRansformer (MTR) フレームワークを提案する。
最初のMTRフレームワークは、学習可能な意図クエリを備えたトランスフォーマーエンコーダ-デコーダ構造を利用する。
複数のエージェントに対するマルチモーダル動作を同時に予測するMTR++フレームワークを導入する。
論文 参考訳(メタデータ) (2023-06-30T16:23:04Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z) - Fully Decentralized Model-based Policy Optimization for Networked
Systems [23.46407780093797]
本研究の目的は,モデルベース学習によるマルチエージェント制御のデータ効率の向上である。
エージェントが協力的であり、隣人とのみローカルに通信するネットワークシステムについて検討する。
提案手法では,各エージェントが将来の状態を予測し,通信によって予測をブロードキャストする動的モデルを学習し,その後,モデルロールアウトに基づいてポリシーをトレーニングする。
論文 参考訳(メタデータ) (2022-07-13T23:52:14Z) - A Meta Reinforcement Learning Approach for Predictive Autoscaling in the
Cloud [10.970391043991363]
本稿では,CPU利用の安定レベルを維持するために資源を最適に割り当てることを目的とした,エンドツーエンドのメタモデルに基づくRLアルゴリズムを提案する。
当社のアルゴリズムは,スケーリング戦略の予測可能性と精度を確保するだけでなく,スケーリング決定が変化するワークロードに高いサンプル効率で適応できるようにする。
論文 参考訳(メタデータ) (2022-05-31T13:54:04Z) - Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline
Reinforcement Learning [114.36124979578896]
オフライン強化学習アルゴリズムを用いて動的メカニズムを設計する。
我々のアルゴリズムは悲観主義の原理に基づいており、オフラインデータセットのカバレッジについて軽度な仮定しか必要としない。
論文 参考訳(メタデータ) (2022-05-05T05:44:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。