論文の概要: Machine Learning (ML)-Centric Resource Management in Cloud Computing: A
Review and Future Directions
- arxiv url: http://arxiv.org/abs/2105.05079v1
- Date: Sun, 9 May 2021 08:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-12 13:45:30.203951
- Title: Machine Learning (ML)-Centric Resource Management in Cloud Computing: A
Review and Future Directions
- Title(参考訳): 機械学習(ML)によるクラウドコンピューティングのリソース管理 - 展望と今後の方向性
- Authors: Tahseen Khan, Wenhong Tian, Rajkumar Buyya
- Abstract要約: インフラストラクチャ・アズ・ア・サービス(I)は、最も重要かつ急速に成長する分野の1つです。
私のクラウドコンピューティングの最も重要な側面の1つは、リソース管理です。
機械学習は、さまざまなリソース管理タスクを処理するために使用されます。
- 参考スコア(独自算出の注目度): 22.779373079539713
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cloud computing has rapidly emerged as model for delivering Internet-based
utility computing services. In cloud computing, Infrastructure as a Service
(IaaS) is one of the most important and rapidly growing fields. Cloud providers
provide users/machines resources such as virtual machines, raw (block) storage,
firewalls, load balancers, and network devices in this service model. One of
the most important aspects of cloud computing for IaaS is resource management.
Scalability, quality of service, optimum utility, reduced overheads, increased
throughput, reduced latency, specialised environment, cost effectiveness, and a
streamlined interface are some of the advantages of resource management for
IaaS in cloud computing. Traditionally, resource management has been done
through static policies, which impose certain limitations in various dynamic
scenarios, prompting cloud service providers to adopt data-driven,
machine-learning-based approaches. Machine learning is being used to handle a
variety of resource management tasks, including workload estimation, task
scheduling, VM consolidation, resource optimization, and energy optimization,
among others. This paper provides a detailed review of challenges in ML-based
resource management in current research, as well as current approaches to
resolve these challenges, as well as their advantages and limitations. Finally,
we propose potential future research directions based on identified challenges
and limitations in current research.
- Abstract(参考訳): クラウドコンピューティングはインターネットベースのユーティリティコンピューティングサービスを提供するモデルとして急速に現れてきた。
クラウドコンピューティングでは、IaaS(Infrastructure as a Service)が最も重要で急速に成長している分野の1つです。
クラウドプロバイダはこのサービスモデルで、仮想マシン、生(ブロック)ストレージ、ファイアウォール、ロードバランサ、ネットワークデバイスなどのユーザ/マシンリソースを提供する。
IaaSにおけるクラウドコンピューティングの最も重要な側面の1つは、リソース管理である。
スケーラビリティ、サービス品質、最適ユーティリティ、オーバーヘッドの削減、スループットの向上、レイテンシの削減、特殊化環境、コスト効率、および合理化インターフェースは、クラウドコンピューティングにおけるIaaSのリソース管理の利点の1つである。
伝統的に、リソース管理は静的ポリシを通じて行われており、さまざまな動的シナリオに一定の制限が課され、クラウドサービスプロバイダがデータ駆動の機械学習ベースのアプローチを採用するように促されている。
機械学習は、ワークロード推定、タスクスケジューリング、VMの統合、リソース最適化、エネルギー最適化など、さまざまなリソース管理タスクを処理するために使用されている。
本稿では,最近の研究におけるmlベースのリソース管理の課題と,これらの課題を解決する現在のアプローチ,そのメリットと限界について,詳細なレビューを行う。
最後に,現在の研究における課題と限界に基づいた今後の研究方向性を提案する。
関連論文リスト
- Application of Machine Learning Optimization in Cloud Computing Resource
Scheduling and Management [18.462300407761873]
中国のクラウドコンピューティングの規模は209億元に達した。
本稿では,クラウドコンピューティング資源のスケジューリングと管理において,複雑な問題を解くための革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-02-27T05:14:27Z) - Computing in the Era of Large Generative Models: From Cloud-Native to
AI-Native [46.7766555589807]
クラウドネイティブ技術と高度な機械学習推論の両方のパワーを利用するAIネイティブコンピューティングパラダイムについて説明する。
これらの共同作業は、コスト・オブ・グッド・ソード(COGS)を最適化し、資源のアクセシビリティを向上させることを目的としている。
論文 参考訳(メタデータ) (2024-01-17T20:34:11Z) - Sustainable AIGC Workload Scheduling of Geo-Distributed Data Centers: A
Multi-Agent Reinforcement Learning Approach [48.18355658448509]
生成的人工知能の最近の進歩は、機械学習トレーニングの需要が急増し、エネルギー消費の大幅な増加によるコスト負担と環境問題を引き起こしている。
地理的に分散したクラウドデータセンタ間でのトレーニングジョブのスケジューリングは、安価で低炭素エネルギーのコンピューティング能力の使用を最適化する機会を浮き彫りにする。
本研究では,実生活におけるワークロードパターン,エネルギー価格,炭素強度を組み込んだクラウドシステムと対話することで,マルチエージェント強化学習とアクタクリティカルな手法に基づく最適協調スケジューリング戦略の学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-17T02:12:30Z) - Measuring the Carbon Intensity of AI in Cloud Instances [91.28501520271972]
我々は,ソフトウェアの炭素強度を測定するための枠組みを提供し,運転中の炭素排出量を測定することを提案する。
私たちは、Microsoft Azureクラウドコンピューティングプラットフォームにおける排出削減のための一連のアプローチを評価します。
論文 参考訳(メタデータ) (2022-06-10T17:04:04Z) - A Survey on Machine Learning for Geo-Distributed Cloud Data Center
Management [4.226118870861363]
クラウドサービスプロバイダは、運用コストを削減し、サービス品質を向上させるために、データセンタを世界中に配布しています。
このような大規模かつ複雑なソフトウェアワークロードとハードウェアリソースのオーケストレーションは、効率的な解決が難しい問題です。
本稿では,クラウドデータセンタ管理問題に対する最先端の機械学習技術について概説する。
論文 参考訳(メタデータ) (2022-05-17T03:14:54Z) - HUNTER: AI based Holistic Resource Management for Sustainable Cloud
Computing [26.48962351761643]
我々は,HUNTERと呼ばれる持続可能なクラウドコンピューティングのための人工知能(AI)に基づく総合的資源管理手法を提案する。
提案モデルでは,多目的スケジューリング問題として,データセンターのエネルギー効率を最適化する目標を定式化している。
シミュレーションおよび物理雲環境の実験により、HUNTERはエネルギー消費、SLA違反、スケジューリング時間、コスト、温度を最大12、35、43、54、3%で上回った。
論文 参考訳(メタデータ) (2021-10-11T18:11:26Z) - The MIT Supercloud Dataset [3.375826083518709]
我々は、大規模なHPCとデータセンター/クラウドオペレーションの分析において、革新的なAI/MLアプローチを促進することを目的とした、MIT Supercloudデータセットを紹介します。
我々は、ジョブ毎のCPUおよびGPU使用率、メモリ使用率、ファイルシステムログ、物理モニタリングデータを含む、MIT Supercloudシステムから詳細な監視ログを提供する。
本稿では,データセットの詳細,収集手法,データ可用性について論じ,このデータを用いて開発されている潜在的な課題について論じる。
論文 参考訳(メタデータ) (2021-08-04T13:06:17Z) - Power Modeling for Effective Datacenter Planning and Compute Management [53.41102502425513]
我々は,すべてのハードウェア構成とワークロードに適用可能な,正確でシンプルで解釈可能な統計パワーモデルの設計と検証の2つのクラスについて論じる。
提案された統計的モデリング手法は, 単純かつスケーラブルでありながら, 4つの特徴のみを用いて, 95% 以上の多様な配電ユニット (2000 以上) に対して, 5% 未満の絶対パーセンテージエラー (MAPE) で電力を予測できることを実証した。
論文 参考訳(メタデータ) (2021-03-22T21:22:51Z) - Artificial Intelligence (AI)-Centric Management of Resources in Modern
Distributed Computing Systems [22.550075095184514]
Cloud Data Centres (DCS) は大規模で複雑で異種であり、複数のネットワークと地理的境界に分散している。
IoT(Internet of Things)駆動のアプリケーションは、リアルタイム処理と迅速な応答を必要とする膨大なデータを生成しています。
既存のリソース管理システム(RMS)は、そのような複合システムや動的システムには静的またはソリューションが不十分である。
論文 参考訳(メタデータ) (2020-06-09T06:54:07Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。