論文の概要: ReLeaSER: A Reinforcement Learning Strategy for Optimizing Utilization
Of Ephemeral Cloud Resources
- arxiv url: http://arxiv.org/abs/2009.11208v4
- Date: Thu, 10 Dec 2020 10:48:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 17:04:07.089105
- Title: ReLeaSER: A Reinforcement Learning Strategy for Optimizing Utilization
Of Ephemeral Cloud Resources
- Title(参考訳): ReLeaSER: 一時的クラウドリソースの利用を最適化するための強化学習戦略
- Authors: Mohamed Handaoui and Jean-Emile Dartois and Jalil Boukhobza and
Olivier Barais and Laurent d'Orazio
- Abstract要約: 本稿では,クラウド上での短命資源の利用を最適化するための強化学習戦略を提案する。
私たちのソリューションはSLA違反の罰則を平均2.7倍、最大3.4倍に大幅に削減します。
またCPの貯蓄率を平均で27.6%、最大で43.6%向上させる。
- 参考スコア(独自算出の注目度): 2.205500582481277
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cloud data center capacities are over-provisioned to handle demand peaks and
hardware failures which leads to low resources' utilization. One way to improve
resource utilization and thus reduce the total cost of ownership is to offer
unused resources (referred to as ephemeral resources) at a lower price.
However, reselling resources needs to meet the expectations of its customers in
terms of Quality of Service. The goal is so to maximize the amount of reclaimed
resources while avoiding SLA penalties. To achieve that, cloud providers have
to estimate their future utilization to provide availability guarantees. The
prediction should consider a safety margin for resources to react to
unpredictable workloads. The challenge is to find the safety margin that
provides the best trade-off between the amount of resources to reclaim and the
risk of SLA violations. Most state-of-the-art solutions consider a fixed safety
margin for all types of metrics (e.g., CPU, RAM). However, a unique fixed
margin does not consider various workloads variations over time which may lead
to SLA violations or/and poor utilization. In order to tackle these challenges,
we propose ReLeaSER, a Reinforcement Learning strategy for optimizing the
ephemeral resources' utilization in the cloud. ReLeaSER dynamically tunes the
safety margin at the host-level for each resource metric. The strategy learns
from past prediction errors (that caused SLA violations). Our solution reduces
significantly the SLA violation penalties on average by 2.7x and up to 3.4x. It
also improves considerably the CPs' potential savings by 27.6% on average and
up to 43.6%.
- Abstract(参考訳): クラウドデータセンタの能力は、需要ピークとハードウェア障害に対処するために過剰にプロビジョニングされ、リソース使用量の削減につながる。
資源利用の改善と総所有コストの削減の1つの方法は、未使用の資源(短命の資源)を低コストで提供することである。
しかし、リソースの再販は品質・オブ・サービスの観点から顧客の期待に応える必要がある。
目標は、SLAの罰則を避けながら、再利用されたリソースの量を最大化することです。
これを実現するために、クラウドプロバイダは、可用性を保証するために、将来の利用を見積もる必要がある。
予測は、予測不能なワークロードに対応するリソースの安全性マージンを考慮すべきである。
課題は、再利用するリソースの量とSLA違反のリスクの間の最良のトレードオフを提供する安全マージンを見つけることです。
ほとんどの最先端ソリューションでは、すべてのタイプのメトリクス(cpu、ramなど)に対して一定の安全性マージンが考慮されている。
しかし、ユニークな固定マージンは、SLA違反や低利用につながる可能性のあるさまざまなワークロードの変動を時間とともに考慮していない。
これらの課題に対処するために,クラウド上での短命資源の利用を最適化するための強化学習戦略であるReLeaSERを提案する。
ReLeaSERは、各リソースメトリックのホストレベルの安全マージンを動的に調整する。
戦略は過去の予測エラー(SLA違反を引き起こした)から学ぶ。
私たちのソリューションはSLA違反の罰則を平均2.7倍、最大3.4倍に大幅に削減します。
またCPの貯蓄率を平均で27.6%、最大で43.6%向上させる。
関連論文リスト
- Secure Resource Allocation via Constrained Deep Reinforcement Learning [49.15061461220109]
リソース割り当て、タスクオフロード、セキュリティ、パフォーマンスのバランスをとるフレームワークであるSARMTOを紹介します。
SARMTOは5つのベースラインアプローチを一貫して上回り、最大40%のシステムコスト削減を実現している。
これらの拡張は、複雑な分散コンピューティング環境におけるリソース管理に革命をもたらすSARMTOの可能性を強調している。
論文 参考訳(メタデータ) (2025-01-20T15:52:43Z) - Iterative Self-Tuning LLMs for Enhanced Jailbreaking Capabilities [63.603861880022954]
本稿では,対戦型LDMをジェイルブレイク能力に富んだ反復的自己調整プロセスであるADV-LLMを紹介する。
我々のフレームワークは,様々なオープンソース LLM 上で ASR を100% 近く達成しながら,逆接接尾辞を生成する計算コストを大幅に削減する。
Llama3のみに最適化されているにもかかわらず、GPT-3.5では99%のASR、GPT-4では49%のASRを達成している。
論文 参考訳(メタデータ) (2024-10-24T06:36:12Z) - Multi-Level ML Based Burst-Aware Autoscaling for SLO Assurance and Cost
Efficiency [3.5624365288866007]
本稿では、複雑なワークロード下でコンテナ化されたクラウドサービスやアプリケーションのためのBurst-Aware AutoscalingフレームワークであるBAScalerを紹介します。
BAScalerには、予測可能な周期的なワークロードスパイクと実際のバーストを区別する、予測に基づく新しいバースト検出機構が組み込まれている。
論文 参考訳(メタデータ) (2024-02-20T12:28:25Z) - Secure Deep Reinforcement Learning for Dynamic Resource Allocation in
Wireless MEC Networks [46.689212344009015]
本稿では,モバイルエッジコンピューティングネットワークにおけるデータ管理とリソース割り当てのためのブロックチェーンセキュアな深層強化学習(BC-DRL)最適化フレームワークを提案する。
我々は、信頼性の高いブロックチェーン対応BSを選択するために、低レイテンシの評判に基づくRPoSコンセンサスプロトコルを設計する。
我々は、BC-DRLフレームワークが、ベンチマークブロックチェーンコンセンサスプロトコルやMECリソース割り当てアルゴリズムよりも高いセキュリティ、信頼性、リソース利用効率を達成することを検証するために、広範なシミュレーション結果と分析を提供する。
論文 参考訳(メタデータ) (2023-12-13T09:39:32Z) - Reconciling High Accuracy, Cost-Efficiency, and Low Latency of Inference
Serving Systems [0.0]
InfAdapterは、レイテンシSLOを満たすために、リソース割り当てでMLモデルの一連の変種を積極的に選択する。
SLO違反を減らし、業界で人気のオートスケーラと比較して、それぞれ65%と33%に値下げする。
論文 参考訳(メタデータ) (2023-04-21T11:19:49Z) - RISCLESS: A Reinforcement Learning Strategy to Exploit Unused Cloud
Resources [0.44634886884474834]
Cloud Providers(CP)の主な目的の1つは、顧客のSLA(Service-Level Agreement)を保証することである。
本稿では、未使用のクラウドリソースを活用するための強化学習戦略RISCLESSを提案する。
論文 参考訳(メタデータ) (2022-04-28T06:49:24Z) - PROMPT: Learning Dynamic Resource Allocation Policies for Network
Applications [16.812611987082082]
本稿では、プロアクティブな予測を用いて強化学習コントローラを誘導する新しいリソース割り当てフレームワークPROMPTを提案する。
本稿では,PROMPTが4.2倍少ない違反を発生させ,政策違反の深刻度を12.7倍に低減し,最善を尽くした作業負荷性能を向上し,先行作業よりも全体的な電力効率を向上することを示す。
論文 参考訳(メタデータ) (2022-01-19T23:34:34Z) - Coordinated Online Learning for Multi-Agent Systems with Coupled
Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。
提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文 参考訳(メタデータ) (2020-10-21T10:11:17Z) - A Predictive Autoscaler for Elastic Batch Jobs [8.354712625979776]
Deep Learning、HPC、Sparkといった大規模なバッチジョブは、従来のオンラインサービスよりもはるかに多くの計算リソースとコストを必要とします。
顧客とオーバプロビジョンインスタンスに対して,柔軟なインターフェースを提供するための予測オートスケーラを提案する。
論文 参考訳(メタデータ) (2020-10-10T17:35:55Z) - Pollux: Co-adaptive Cluster Scheduling for Goodput-Optimized Deep
Learning [61.29990368322931]
Polluxは、相互依存要因を適応的に最適化することで、ディープラーニング(DL)クラスタのスケジューリング性能を改善する。
Polluxは、最先端のDLスケジューラと比較して、平均的なジョブ完了時間を37-50%削減する。
論文 参考訳(メタデータ) (2020-08-27T16:56:48Z) - Hierarchical Adaptive Contextual Bandits for Resource Constraint based
Recommendation [49.69139684065241]
コンテキスト多重武装バンディット(MAB)は、様々な問題において最先端のパフォーマンスを達成する。
本稿では,階層型適応型文脈帯域幅法(HATCH)を提案する。
論文 参考訳(メタデータ) (2020-04-02T17:04:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。