論文の概要: Artificial Intelligence (AI)-Centric Management of Resources in Modern
Distributed Computing Systems
- arxiv url: http://arxiv.org/abs/2006.05075v2
- Date: Sat, 7 Nov 2020 01:47:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 15:37:41.251240
- Title: Artificial Intelligence (AI)-Centric Management of Resources in Modern
Distributed Computing Systems
- Title(参考訳): 人工知能(AI)-現代の分散コンピューティングシステムにおける資源の集中管理
- Authors: Shashikant Ilager, Rajeev Muralidhar and Rajkumar Buyya
- Abstract要約: Cloud Data Centres (DCS) は大規模で複雑で異種であり、複数のネットワークと地理的境界に分散している。
IoT(Internet of Things)駆動のアプリケーションは、リアルタイム処理と迅速な応答を必要とする膨大なデータを生成しています。
既存のリソース管理システム(RMS)は、そのような複合システムや動的システムには静的またはソリューションが不十分である。
- 参考スコア(独自算出の注目度): 22.550075095184514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contemporary Distributed Computing Systems (DCS) such as Cloud Data Centres
are large scale, complex, heterogeneous, and distributed across multiple
networks and geographical boundaries. On the other hand, the Internet of Things
(IoT)-driven applications are producing a huge amount of data that requires
real-time processing and fast response. Managing these resources efficiently to
provide reliable services to end-users or applications is a challenging task.
The existing Resource Management Systems (RMS) rely on either static or
heuristic solutions inadequate for such composite and dynamic systems. The
advent of Artificial Intelligence (AI) due to data availability and processing
capabilities manifested into possibilities of exploring data-driven solutions
in RMS tasks that are adaptive, accurate, and efficient. In this regard, this
paper aims to draw the motivations and necessities for data-driven solutions in
resource management. It identifies the challenges associated with it and
outlines the potential future research directions detailing where and how to
apply the data-driven techniques in the different RMS tasks. Finally, it
provides a conceptual data-driven RMS model for DCS and presents the two
real-time use cases (GPU frequency scaling and data centre resource management
from Google Cloud and Microsoft Azure) demonstrating AI-centric approaches'
feasibility.
- Abstract(参考訳): クラウドデータセンターのような現代の分散コンピューティングシステム(DCS)は大規模で複雑で異質であり、複数のネットワークと地理的境界に分散している。
一方、モノのインターネット(IoT)駆動のアプリケーションは、リアルタイム処理と迅速な応答を必要とする膨大な量のデータを生成しています。
これらのリソースを効率的に管理して、エンドユーザやアプリケーションに信頼できるサービスを提供するのは、難しい作業です。
既存のリソース管理システム(RMS)は、そのような複合システムや動的システムに不適切な静的またはヒューリスティックなソリューションに依存している。
データ可用性と処理能力による人工知能(AI)の出現は、適応的で正確で効率的なRMSタスクにおいて、データ駆動型ソリューションを探索する可能性に現れました。
本稿では,資源管理におけるデータ駆動型ソリューションのモチベーションと必要性について考察する。
それはそれに関連する課題を特定し、異なるrmsタスクにデータ駆動技術を適用する場所と方法を詳述する将来の研究の方向性を概説する。
最後に、DCS用の概念的データ駆動RMSモデルを提供し、AI中心のアプローチの実現可能性を示す2つのリアルタイムユースケース(GPU周波数スケーリングとGoogle CloudとMicrosoft Azureのデータセンタリソース管理)を提示する。
関連論文リスト
- Automatic AI Model Selection for Wireless Systems: Online Learning via Digital Twinning [50.332027356848094]
AIベースのアプリケーションは、スケジューリングや電力制御などの機能を実行するために、インテリジェントコントローラにデプロイされる。
コンテキストとAIモデルのパラメータのマッピングは、ゼロショット方式で理想的に行われる。
本稿では,AMSマッピングのオンライン最適化のための一般的な手法を紹介する。
論文 参考訳(メタデータ) (2024-06-22T11:17:50Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with
Online Learning [60.17407932691429]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - Bringing AI to the edge: A formal M&S specification to deploy effective
IoT architectures [0.0]
モノのインターネットは私たちの社会を変え、生活の質と資源管理を改善する新しいサービスを提供しています。
これらのアプリケーションは、限られたコンピューティングリソースとパワーを持つ、複数の分散デバイスのユビキタスネットワークに基づいている。
フォグコンピューティングのような新しいアーキテクチャが登場し、コンピューティング基盤をデータソースに近づけている。
論文 参考訳(メタデータ) (2023-05-11T21:29:58Z) - Outsourcing Training without Uploading Data via Efficient Collaborative
Open-Source Sampling [49.87637449243698]
従来のアウトソーシングでは、デバイスデータをクラウドサーバにアップロードする必要がある。
我々は、公開および異種ソースから収集された膨大なデータセットである、広く利用可能なオープンソースデータを活用することを提案する。
我々は,オープンソースデータからクラウドトレーニングのためのプロキシデータセットを構築するための,ECOS(Efficient Collaborative Open-source Sampling)と呼ばれる新しい戦略を開発した。
論文 参考訳(メタデータ) (2022-10-23T00:12:18Z) - A Survey on Machine Learning for Geo-Distributed Cloud Data Center
Management [4.226118870861363]
クラウドサービスプロバイダは、運用コストを削減し、サービス品質を向上させるために、データセンタを世界中に配布しています。
このような大規模かつ複雑なソフトウェアワークロードとハードウェアリソースのオーケストレーションは、効率的な解決が難しい問題です。
本稿では,クラウドデータセンタ管理問題に対する最先端の機械学習技術について概説する。
論文 参考訳(メタデータ) (2022-05-17T03:14:54Z) - Machine Learning Empowered Intelligent Data Center Networking: A Survey [35.55535885962517]
本稿では,機械学習のデータセンターネットワークへの応用を包括的に検討する。
フロー予測、フロー分類、ロードバランシング、リソース管理、ルーティング最適化、渋滞制御をカバーしている。
我々はREBEL-3Sと呼ばれる品質評価基準を設計し、これらの研究の長所と短所を公平に測定する。
論文 参考訳(メタデータ) (2022-02-28T05:27:22Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - HUNTER: AI based Holistic Resource Management for Sustainable Cloud
Computing [26.48962351761643]
我々は,HUNTERと呼ばれる持続可能なクラウドコンピューティングのための人工知能(AI)に基づく総合的資源管理手法を提案する。
提案モデルでは,多目的スケジューリング問題として,データセンターのエネルギー効率を最適化する目標を定式化している。
シミュレーションおよび物理雲環境の実験により、HUNTERはエネルギー消費、SLA違反、スケジューリング時間、コスト、温度を最大12、35、43、54、3%で上回った。
論文 参考訳(メタデータ) (2021-10-11T18:11:26Z) - Machine Learning (ML)-Centric Resource Management in Cloud Computing: A
Review and Future Directions [22.779373079539713]
インフラストラクチャ・アズ・ア・サービス(I)は、最も重要かつ急速に成長する分野の1つです。
私のクラウドコンピューティングの最も重要な側面の1つは、リソース管理です。
機械学習は、さまざまなリソース管理タスクを処理するために使用されます。
論文 参考訳(メタデータ) (2021-05-09T08:03:58Z) - Power Modeling for Effective Datacenter Planning and Compute Management [53.41102502425513]
我々は,すべてのハードウェア構成とワークロードに適用可能な,正確でシンプルで解釈可能な統計パワーモデルの設計と検証の2つのクラスについて論じる。
提案された統計的モデリング手法は, 単純かつスケーラブルでありながら, 4つの特徴のみを用いて, 95% 以上の多様な配電ユニット (2000 以上) に対して, 5% 未満の絶対パーセンテージエラー (MAPE) で電力を予測できることを実証した。
論文 参考訳(メタデータ) (2021-03-22T21:22:51Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。