論文の概要: OptScaler: A Collaborative Framework for Robust Autoscaling in the Cloud
- arxiv url: http://arxiv.org/abs/2311.12864v2
- Date: Wed, 05 Feb 2025 09:14:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 14:24:13.905509
- Title: OptScaler: A Collaborative Framework for Robust Autoscaling in the Cloud
- Title(参考訳): OptScaler: クラウドにおけるロバスト自動スケーリングのための協調フレームワーク
- Authors: Ding Zou, Wei Lu, Zhibo Zhu, Xingyu Lu, Jun Zhou, Xiaojin Wang, Kangyu Liu, Haiqing Wang, Kefan Wang, Renen Sun,
- Abstract要約: 最適化モジュールを通じてプロアクティブおよびリアクティブモジュールを統合する,協調的な自動スケーリングフレームワークであるOpsScalerを提案する。
数値計算の結果,ワークロード予測モデルと協調フレームワークの優位性が示された。
- 参考スコア(独自算出の注目度): 10.97507717758812
- License:
- Abstract: Autoscaling is a critical mechanism in cloud computing, enabling the autonomous adjustment of computing resources in response to dynamic workloads. This is particularly valuable for co-located, long-running applications with diverse workload patterns. The primary objective of autoscaling is to regulate resource utilization at a desired level, effectively balancing the need for resource optimization with the fulfillment of Service Level Objectives (SLOs). Many existing proactive autoscaling frameworks may encounter prediction deviations arising from the frequent fluctuations of cloud workloads. Reactive frameworks, on the other hand, rely on realtime system feedback, but their hysteretic nature could lead to violations of stringent SLOs. Hybrid frameworks, while prevalent, often feature independently functioning proactive and reactive modules, potentially leading to incompatibility and undermining the overall decision-making efficacy. In addressing these challenges, we propose OptScaler, a collaborative autoscaling framework that integrates proactive and reactive modules through an optimization module. The proactive module delivers reliable future workload predictions to the optimization module, while the reactive module offers a self-tuning estimator for real-time updates. By embedding a Model Predictive Control (MPC) mechanism and chance constraints into the optimization module, we further enhance its robustness. Numerical results have demonstrated the superiority of our workload prediction model and the collaborative framework, leading to over a 36% reduction in SLO violations compared to prevalent reactive, proactive, or hybrid autoscalers. Notably, OptScaler has been successfully deployed at Alipay, providing autoscaling support for the world-leading payment platform.
- Abstract(参考訳): クラウドコンピューティングにおいてオートスケーリングは重要なメカニズムであり、動的ワークロードに対するコンピューティングリソースの自律的な調整を可能にする。
これは、様々なワークロードパターンを持つ、一緒に配置された、長時間稼働するアプリケーションにとって、特に価値がある。
自動スケーリングの主な目的は、リソース利用を望ましいレベルで規制し、リソース最適化とサービスレベルオブジェクト(SLO)の履行を効果的にバランスさせることである。
多くの既存のプロアクティブ自動スケーリングフレームワークは、クラウドワークロードの頻繁な変動に起因する予測偏差に遭遇する可能性がある。
一方リアクティブフレームワークは、リアルタイムなシステムフィードバックに依存していますが、そのヒステリックな性質は、厳格なSLOに違反する可能性があるのです。
ハイブリッドフレームワークは広く普及しているが、独立してプロアクティブでリアクティブなモジュールを機能させることが多いため、互換性が低下し、全体的な意思決定の有効性を損なう可能性がある。
これらの課題に対処するために,最適化モジュールを通じてプロアクティブかつリアクティブなモジュールを統合する,協調的な自動スケーリングフレームワークであるOpsScalerを提案する。
Proactiveモジュールは、最適化モジュールに信頼性のある将来的なワークロード予測を提供し、リアクティブモジュールは、リアルタイム更新のためのセルフチューニングの見積を提供する。
モデル予測制御(MPC)機構と確率制約を最適化モジュールに組み込むことで、その堅牢性をさらに強化する。
数値計算の結果,作業負荷予測モデルと協調フレームワークの優位性が示され,SLO違反が36%以上減少した。
特に、OpstScalerはAlipayでうまくデプロイされており、世界主導の支払いプラットフォームの自動スケーリングサポートを提供している。
関連論文リスト
- Modular Framework for Uncertainty Prediction in Autonomous Vehicle Motion Forecasting within Complex Traffic Scenarios [6.6603214802161546]
我々のフレームワークは、フレキシブルでエンドツーエンドの差別化可能なエンコーダ-デコーダアーキテクチャを採用している。
主な貢献は、動的予測のためにコンテキスト対応の占有グリッドを生成する確率的ヒートマップ予測器である。
エンドツーエンドのベースラインに対してベンチマークを行い、より高速な収束、安定性の向上、柔軟性を示しています。
論文 参考訳(メタデータ) (2025-01-27T20:21:18Z) - Optimizing Small Language Models for In-Vehicle Function-Calling [4.148443557388842]
本稿では,小型言語モデル(SLM)をエッジデバイスとして車両内の機能呼び出しエージェントとして展開するための総合的アプローチを提案する。
SLMを利用することで、車両制御機構を簡素化し、ユーザエクスペリエンスを向上させる。
論文 参考訳(メタデータ) (2025-01-04T17:32:56Z) - Microservices-Based Framework for Predictive Analytics and Real-time Performance Enhancement in Travel Reservation Systems [1.03590082373586]
本稿では,リアルタイム旅行予約システムの性能向上を目的としたアーキテクチャの枠組みを提案する。
私たちのフレームワークには、顧客の需要予測を最適化する機械学習モデルによるリアルタイム予測分析、動的価格設定、システムパフォーマンスが含まれています。
今後は、高度なAIモデルとエッジ処理を調査して、採用するシステムのパフォーマンスと堅牢性をさらに向上する予定である。
論文 参考訳(メタデータ) (2024-12-20T07:19:42Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - Model-based Causal Bayesian Optimization [74.78486244786083]
乗算重み付き因果ベイズ最適化のための最初のアルゴリズム(CBO-MW)を提案する。
グラフ関連の量に自然に依存するCBO-MWに対する後悔の限界を導出する。
我々の実験は、共有モビリティシステムにおいて、ユーザの需要パターンを学習するためにCBO-MWをどのように使用できるかの現実的なデモを含む。
論文 参考訳(メタデータ) (2023-07-31T13:02:36Z) - MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and
Guided Intention Querying [110.83590008788745]
自律運転システムにとって、複雑な運転シナリオを理解し、情報的な決定を下すためには、動きの予測が不可欠である。
本稿では,これらの課題に対処するためのMotion TRansformer (MTR) フレームワークを提案する。
最初のMTRフレームワークは、学習可能な意図クエリを備えたトランスフォーマーエンコーダ-デコーダ構造を利用する。
複数のエージェントに対するマルチモーダル動作を同時に予測するMTR++フレームワークを導入する。
論文 参考訳(メタデータ) (2023-06-30T16:23:04Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z) - Fully Decentralized Model-based Policy Optimization for Networked
Systems [23.46407780093797]
本研究の目的は,モデルベース学習によるマルチエージェント制御のデータ効率の向上である。
エージェントが協力的であり、隣人とのみローカルに通信するネットワークシステムについて検討する。
提案手法では,各エージェントが将来の状態を予測し,通信によって予測をブロードキャストする動的モデルを学習し,その後,モデルロールアウトに基づいてポリシーをトレーニングする。
論文 参考訳(メタデータ) (2022-07-13T23:52:14Z) - A Meta Reinforcement Learning Approach for Predictive Autoscaling in the
Cloud [10.970391043991363]
本稿では,CPU利用の安定レベルを維持するために資源を最適に割り当てることを目的とした,エンドツーエンドのメタモデルに基づくRLアルゴリズムを提案する。
当社のアルゴリズムは,スケーリング戦略の予測可能性と精度を確保するだけでなく,スケーリング決定が変化するワークロードに高いサンプル効率で適応できるようにする。
論文 参考訳(メタデータ) (2022-05-31T13:54:04Z) - Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline
Reinforcement Learning [114.36124979578896]
オフライン強化学習アルゴリズムを用いて動的メカニズムを設計する。
我々のアルゴリズムは悲観主義の原理に基づいており、オフラインデータセットのカバレッジについて軽度な仮定しか必要としない。
論文 参考訳(メタデータ) (2022-05-05T05:44:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。