論文の概要: AHPA: Adaptive Horizontal Pod Autoscaling Systems on Alibaba Cloud
Container Service for Kubernetes
- arxiv url: http://arxiv.org/abs/2303.03640v1
- Date: Tue, 7 Mar 2023 04:04:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-08 16:36:54.559054
- Title: AHPA: Adaptive Horizontal Pod Autoscaling Systems on Alibaba Cloud
Container Service for Kubernetes
- Title(参考訳): AHPA: Alibaba Cloud Container Service for Kubernetes上の適応水平ポッド自動スケーリングシステム
- Authors: Zhiqiang Zhou, Chaoli Zhang, Lingna Ma, Jing Gu, Huajie Qian, Qingsong
Wen, Liang Sun, Peng Li, Zhimin Tang
- Abstract要約: 本稿では,Alibaba Cloud Container Servicesにおける水平PODリソース管理について,新たにデプロイされたAIアルゴリズムフレームワークであるAHPAで論じる。
AHPAは、PODリソースを削減し、ビジネス安定性を維持することができる最適なポッド数調整計画を提供している。
従来のアルゴリズムと比較して、AHPAは弾力的なラグ問題を解決し、CPU使用量を10%増加させ、リソースコストを20%以上削減した。
- 参考スコア(独自算出の注目度): 17.03307505095553
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The existing resource allocation policy for application instances in
Kubernetes cannot dynamically adjust according to the requirement of business,
which would cause an enormous waste of resources during fluctuations. Moreover,
the emergence of new cloud services puts higher resource management
requirements. This paper discusses horizontal POD resources management in
Alibaba Cloud Container Services with a newly deployed AI algorithm framework
named AHPA -- the adaptive horizontal pod auto-scaling system. Based on a
robust decomposition forecasting algorithm and performance training model, AHPA
offers an optimal pod number adjustment plan that could reduce POD resources
and maintain business stability. Since being deployed in April 2021, this
system has expanded to multiple customer scenarios, including logistics, social
networks, AI audio and video, e-commerce, etc. Compared with the previous
algorithms, AHPA solves the elastic lag problem, increasing CPU usage by 10%
and reducing resource cost by more than 20%. In addition, AHPA can
automatically perform flexible planning according to the predicted business
volume without manual intervention, significantly saving operation and
maintenance costs.
- Abstract(参考訳): Kubernetesのアプリケーションインスタンスに対する既存のリソース割り当てポリシは、ビジネス要件に従って動的に調整することはできない。
さらに、新しいクラウドサービスの出現は、リソース管理の要求を高くする。
本稿では、アダプティブ水平ポッド自動スケーリングシステムであるAHPAという、新たにデプロイされたAIアルゴリズムフレームワークを用いて、Alibaba Cloud Container Servicesにおける水平PODリソース管理について論じる。
AHPAは、ロバストな分解予測アルゴリズムと性能訓練モデルに基づいて、PODリソースを削減し、ビジネス安定性を維持できる最適なポッド数調整計画を提供する。
2021年4月に配備されたこのシステムは、ロジスティクス、ソーシャルネットワーク、AIオーディオとビデオ、eコマースなど、複数の顧客シナリオに拡張されている。
従来のアルゴリズムと比較して、AHPAはエラスティックラグ問題を解決し、CPU使用量を10%増加させ、リソースコストを20%以上削減した。
さらに、AHPAは、手作業による介入を伴わずに、予測された業務量に応じて自動的に柔軟な計画を実行でき、運用とメンテナンスのコストを大幅に削減できる。
関連論文リスト
- Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0337199834612]
Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文 参考訳(メタデータ) (2024-11-03T07:01:13Z) - A Learning-based Incentive Mechanism for Mobile AIGC Service in Decentralized Internet of Vehicles [49.86094523878003]
モバイルAIGCサービスアロケーションのための分散インセンティブ機構を提案する。
我々は、AIGCサービスのRSUへの供給と、IoVコンテキスト内のサービスに対するユーザ要求のバランスを見つけるために、マルチエージェントの深層強化学習を採用している。
論文 参考訳(メタデータ) (2024-03-29T12:46:07Z) - Multi-Level ML Based Burst-Aware Autoscaling for SLO Assurance and Cost
Efficiency [3.5624365288866007]
本稿では、複雑なワークロード下でコンテナ化されたクラウドサービスやアプリケーションのためのBurst-Aware AutoscalingフレームワークであるBAScalerを紹介します。
BAScalerには、予測可能な周期的なワークロードスパイクと実際のバーストを区別する、予測に基づく新しいバースト検出機構が組み込まれている。
論文 参考訳(メタデータ) (2024-02-20T12:28:25Z) - Sustainable AIGC Workload Scheduling of Geo-Distributed Data Centers: A
Multi-Agent Reinforcement Learning Approach [48.18355658448509]
生成的人工知能の最近の進歩は、機械学習トレーニングの需要が急増し、エネルギー消費の大幅な増加によるコスト負担と環境問題を引き起こしている。
地理的に分散したクラウドデータセンタ間でのトレーニングジョブのスケジューリングは、安価で低炭素エネルギーのコンピューティング能力の使用を最適化する機会を浮き彫りにする。
本研究では,実生活におけるワークロードパターン,エネルギー価格,炭素強度を組み込んだクラウドシステムと対話することで,マルチエージェント強化学習とアクタクリティカルな手法に基づく最適協調スケジューリング戦略の学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-17T02:12:30Z) - CILP: Co-simulation based Imitation Learner for Dynamic Resource
Provisioning in Cloud Computing Environments [13.864161788250856]
レイテンシクリティカルなタスクの主な課題は、積極的にプロビジョニングする将来のワークロード要求を予測することだ。
既存のAIベースのソリューションは、プロビジョニングのオーバーヘッド、異種VMコスト、クラウドシステムの品質(QoS)など、すべての重要な側面を公平に考慮しない傾向があります。
予測と最適化の2つのサブプロブレムとしてVMプロビジョニング問題を定式化するCILPと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-02-11T09:15:34Z) - Differentially Private Deep Q-Learning for Pattern Privacy Preservation
in MEC Offloading [76.0572817182483]
攻撃者は、エッジサーバ(ES)のキュー情報とユーザの使用パターンを推測するために、オフロードの決定を盗み取ることができる。
パターンプライバシ(PP)を維持しつつ,レイテンシ,ESのエネルギー消費,タスク削減率を両立させるオフロード戦略を提案する。
そこで我々はDP-DQOアルゴリズムを開発し,PP問題にノイズを注入することでこの問題に対処する。
論文 参考訳(メタデータ) (2023-02-09T12:50:18Z) - A Nonparametric Contextual Bandit with Arm-level Eligibility Control for
Customer Service Routing [61.10434777324718]
Amazon Customer Serviceは、毎年数百万の顧客連絡先をリアルタイムにサポートしている。
ボット・リゾルバは一部のトラフィックを自動化するのに役立ちますが、人間エージェントの需要は高いままです。
論文 参考訳(メタデータ) (2022-09-08T19:20:20Z) - Tailored Learning-Based Scheduling for Kubernetes-Oriented Edge-Cloud
System [54.588242387136376]
エッジクラウドシステムのための学習ベースのスケジューリングフレームワークkaisを紹介する。
まず,分散した要求ディスパッチに対応するために,協調型マルチエージェントアクタ-クリティックアルゴリズムを設計する。
次に,多種多様なシステムスケールと構造について,グラフニューラルネットワークを用いてシステム状態情報を埋め込む。
第3に、リクエストディスパッチとサービスオーケストレーションを調和させる2段階のスケジューリングメカニズムを採用します。
論文 参考訳(メタデータ) (2021-01-17T03:45:25Z) - A Predictive Autoscaler for Elastic Batch Jobs [8.354712625979776]
Deep Learning、HPC、Sparkといった大規模なバッチジョブは、従来のオンラインサービスよりもはるかに多くの計算リソースとコストを必要とします。
顧客とオーバプロビジョンインスタンスに対して,柔軟なインターフェースを提供するための予測オートスケーラを提案する。
論文 参考訳(メタデータ) (2020-10-10T17:35:55Z) - DCAF: A Dynamic Computation Allocation Framework for Online Serving
System [20.705598408760952]
オンラインサービスシステムは,各トラフィック要求を異なる方法で処理し,その価値に基づいて「個人化」リソースを割り当てる,という新しい考え方を導入する。
私たちは20%の計算リソース削減で、同じビジネスパフォーマンスを維持することができます。
論文 参考訳(メタデータ) (2020-06-17T07:00:57Z) - AI-based Resource Allocation: Reinforcement Learning for Adaptive
Auto-scaling in Serverless Environments [0.0]
近年、サーバーレスコンピューティングはクラウドコンピューティングモデルの魅力的な新しいパラダイムとして現れています。
商用およびオープンソースのサーバレスコンピューティングプラットフォームに共通するアプローチは、ワークロードベースの自動スケーリングである。
本稿では、サーバーレスフレームワークにおける要求ベース自動スケーリングに対する強化学習アプローチの適用性について検討する。
論文 参考訳(メタデータ) (2020-05-29T06:18:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。