論文の概要: HUNTER: AI based Holistic Resource Management for Sustainable Cloud
Computing
- arxiv url: http://arxiv.org/abs/2110.05529v1
- Date: Mon, 11 Oct 2021 18:11:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 09:19:17.368268
- Title: HUNTER: AI based Holistic Resource Management for Sustainable Cloud
Computing
- Title(参考訳): HUNTER: 持続可能なクラウドコンピューティングのためのAIベースのホロスティックリソース管理
- Authors: Shreshth Tuli, Sukhpal Singh Gill, Minxian Xu, Peter Garraghan, Rami
Bahsoon, Scharam Dustdar, Rizos Sakellariou, Omer Rana, Rajkumar Buyya,
Giuliano Casale and Nicholas R. Jennings
- Abstract要約: 我々は,HUNTERと呼ばれる持続可能なクラウドコンピューティングのための人工知能(AI)に基づく総合的資源管理手法を提案する。
提案モデルでは,多目的スケジューリング問題として,データセンターのエネルギー効率を最適化する目標を定式化している。
シミュレーションおよび物理雲環境の実験により、HUNTERはエネルギー消費、SLA違反、スケジューリング時間、コスト、温度を最大12、35、43、54、3%で上回った。
- 参考スコア(独自算出の注目度): 26.48962351761643
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The worldwide adoption of cloud data centers (CDCs) has given rise to the
ubiquitous demand for hosting application services on the cloud. Further,
contemporary data-intensive industries have seen a sharp upsurge in the
resource requirements of modern applications. This has led to the provisioning
of an increased number of cloud servers, giving rise to higher energy
consumption and, consequently, sustainability concerns. Traditional heuristics
and reinforcement learning based algorithms for energy-efficient cloud resource
management address the scalability and adaptability related challenges to a
limited extent. Existing work often fails to capture dependencies across
thermal characteristics of hosts, resource consumption of tasks and the
corresponding scheduling decisions. This leads to poor scalability and an
increase in the compute resource requirements, particularly in environments
with non-stationary resource demands. To address these limitations, we propose
an artificial intelligence (AI) based holistic resource management technique
for sustainable cloud computing called HUNTER. The proposed model formulates
the goal of optimizing energy efficiency in data centers as a multi-objective
scheduling problem, considering three important models: energy, thermal and
cooling. HUNTER utilizes a Gated Graph Convolution Network as a surrogate model
for approximating the Quality of Service (QoS) for a system state and
generating optimal scheduling decisions. Experiments on simulated and physical
cloud environments using the CloudSim toolkit and the COSCO framework show that
HUNTER outperforms state-of-the-art baselines in terms of energy consumption,
SLA violation, scheduling time, cost and temperature by up to 12, 35, 43, 54
and 3 percent respectively.
- Abstract(参考訳): 世界中のクラウドデータセンタ(CDC)の採用は、クラウド上のアプリケーションサービスホスティングに対するユビキタスな需要を生み出している。
さらに、現代のデータ集約産業は、現代的なアプリケーションのリソース要求が急増している。
これにより、クラウドサーバのプロビジョニングが増加し、エネルギー消費が増加し、結果として持続可能性に関する懸念が高まっている。
従来のヒューリスティックスと強化学習ベースのアルゴリズムによる、エネルギー効率の高いクラウドリソース管理は、スケーラビリティと適応性に関する課題を限定的に解決する。
既存の作業は、ホストの熱的特性、タスクのリソース消費、およびそれに対応するスケジューリング決定の依存関係をキャプチャできないことが多い。
これによりスケーラビリティが低下し、特に非定常的なリソース要求のある環境では計算リソース要求が増加する。
これらの制約に対処するため,HUNTERと呼ばれる持続可能なクラウドコンピューティングのための人工知能(AI)ベースの総合的資源管理手法を提案する。
提案モデルは,エネルギー,熱,冷却の3つの重要なモデルを考慮した多目的スケジューリング問題として,データセンターにおけるエネルギー効率の最適化を目標とする。
HUNTERは、システム状態のQoS(Quality of Service)を近似し、最適なスケジューリング決定を生成するための代理モデルとして、Gated Graph Convolution Networkを使用している。
CloudSimツールキットとCOSCOフレームワークを用いたシミュレーションおよび物理クラウド環境の実験により、HUNTERは、エネルギー消費、SLA違反、スケジューリング時間、コスト、温度を最大12,35,43,54,3%、最先端のベースラインを上回っている。
関連論文リスト
- Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with
Online Learning [60.17407932691429]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - Dynamic Scheduling for Federated Edge Learning with Streaming Data [56.91063444859008]
我々は,長期的エネルギー制約のある分散エッジデバイスにおいて,トレーニングデータを時間とともにランダムに生成するフェデレーションエッジ学習(FEEL)システムを検討する。
限られた通信リソースとレイテンシ要件のため、各イテレーションでローカルトレーニングプロセスに参加するのはデバイスのサブセットのみである。
論文 参考訳(メタデータ) (2023-05-02T07:41:16Z) - Sustainable AIGC Workload Scheduling of Geo-Distributed Data Centers: A
Multi-Agent Reinforcement Learning Approach [48.18355658448509]
生成的人工知能の最近の進歩は、機械学習トレーニングの需要が急増し、エネルギー消費の大幅な増加によるコスト負担と環境問題を引き起こしている。
地理的に分散したクラウドデータセンタ間でのトレーニングジョブのスケジューリングは、安価で低炭素エネルギーのコンピューティング能力の使用を最適化する機会を浮き彫りにする。
本研究では,実生活におけるワークロードパターン,エネルギー価格,炭素強度を組み込んだクラウドシステムと対話することで,マルチエージェント強化学習とアクタクリティカルな手法に基づく最適協調スケジューリング戦略の学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-17T02:12:30Z) - RARE: Renewable Energy Aware Resource Management in Datacenters [9.488752723308954]
ハイパースケールクラウドプロバイダは、再生可能エネルギーを使用してデータセンターを動かす計画を発表した。
データセンターを動かすために再生可能エネルギーを統合することは、発電が断続的であるため困難である。
再生可能エネルギーからの断続的な電力供給に継続的に適応しつつ、効果的なジョブスケジューリングポリシーを学習するスケジューラを提案する。
論文 参考訳(メタデータ) (2022-11-10T05:17:14Z) - Measuring the Carbon Intensity of AI in Cloud Instances [91.28501520271972]
我々は,ソフトウェアの炭素強度を測定するための枠組みを提供し,運転中の炭素排出量を測定することを提案する。
私たちは、Microsoft Azureクラウドコンピューティングプラットフォームにおける排出削減のための一連のアプローチを評価します。
論文 参考訳(メタデータ) (2022-06-10T17:04:04Z) - Machine Learning (ML)-Centric Resource Management in Cloud Computing: A
Review and Future Directions [22.779373079539713]
インフラストラクチャ・アズ・ア・サービス(I)は、最も重要かつ急速に成長する分野の1つです。
私のクラウドコンピューティングの最も重要な側面の1つは、リソース管理です。
機械学習は、さまざまなリソース管理タスクを処理するために使用されます。
論文 参考訳(メタデータ) (2021-05-09T08:03:58Z) - Performance and Energy-Aware Bi-objective Tasks Scheduling for Cloud
Data Centers [0.0]
クラウドコンピューティングはユーザタスクのリモート実行を可能にする。
スマートシティサービスやアプリケーションにおけるクラウドコンピューティングの普及には、qos(quality of services)に準拠したタスクをタイムリーに実行する必要がある
コンピューティングサーバーの使用の増加は、高エネルギー消費、運用コスト、および環境汚染の問題を強化します。
矛盾する性能とエネルギー目標をトレードオフするために、パフォーマンスとエネルギー最適化の二目的的アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-04-25T08:55:57Z) - Power Modeling for Effective Datacenter Planning and Compute Management [53.41102502425513]
我々は,すべてのハードウェア構成とワークロードに適用可能な,正確でシンプルで解釈可能な統計パワーモデルの設計と検証の2つのクラスについて論じる。
提案された統計的モデリング手法は, 単純かつスケーラブルでありながら, 4つの特徴のみを用いて, 95% 以上の多様な配電ユニット (2000 以上) に対して, 5% 未満の絶対パーセンテージエラー (MAPE) で電力を予測できることを実証した。
論文 参考訳(メタデータ) (2021-03-22T21:22:51Z) - Artificial Intelligence (AI)-Centric Management of Resources in Modern
Distributed Computing Systems [22.550075095184514]
Cloud Data Centres (DCS) は大規模で複雑で異種であり、複数のネットワークと地理的境界に分散している。
IoT(Internet of Things)駆動のアプリケーションは、リアルタイム処理と迅速な応答を必要とする膨大なデータを生成しています。
既存のリソース管理システム(RMS)は、そのような複合システムや動的システムには静的またはソリューションが不十分である。
論文 参考訳(メタデータ) (2020-06-09T06:54:07Z) - Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A
Multi-Agent Deep Reinforcement Learning Approach [82.6692222294594]
マイクログリッドを用いたMECネットワークにおけるリスク対応エネルギースケジューリング問題について検討する。
ニューラルネットワークを用いたマルチエージェントディープ強化学習(MADRL)に基づくアドバンテージアクター・クリティック(A3C)アルゴリズムを適用し,その解を導出する。
論文 参考訳(メタデータ) (2020-02-21T02:14:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。