論文の概要: Towards Fair and Firm Real-Time Scheduling in DNN Multi-Tenant
Multi-Accelerator Systems via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2403.00766v1
- Date: Fri, 9 Feb 2024 07:25:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 00:19:57.428258
- Title: Towards Fair and Firm Real-Time Scheduling in DNN Multi-Tenant
Multi-Accelerator Systems via Reinforcement Learning
- Title(参考訳): 強化学習によるdnnマルチテナントマルチアクセラレータシステムの公平かつ確固たるリアルタイムスケジューリングに向けて
- Authors: Enrico Russo, Francesco Giulio Blanco, Maurizio Palesi, Giuseppe
Ascia, Davide Patti, Vincenzo Catania
- Abstract要約: マルチテナント、マルチアクセラレータクラウド環境におけるテナント固有の管理にDeep Reinforcement Learningを活用する新しいアプローチを導入する。
マルチアクセラレータシステムにおけるディープニューラルネットワークの新しいオンラインスケジューリングアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 1.8781124875646162
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the critical challenge of managing Quality of Service
(QoS) in cloud services, focusing on the nuances of individual tenant
expectations and varying Service Level Indicators (SLIs). It introduces a novel
approach utilizing Deep Reinforcement Learning for tenant-specific QoS
management in multi-tenant, multi-accelerator cloud environments. The chosen
SLI, deadline hit rate, allows clients to tailor QoS for each service request.
A novel online scheduling algorithm for Deep Neural Networks in
multi-accelerator systems is proposed, with a focus on guaranteeing
tenant-wise, model-specific QoS levels while considering real-time constraints.
- Abstract(参考訳): 本稿では,個々のテナントの期待値とサービスレベル指標(slis)の違いに着目し,クラウドサービスにおけるqos(quality of service)管理に関する重要な課題について述べる。
マルチテナントマルチアクセラレータクラウド環境におけるテナント固有のqos管理のための,深層強化学習を活用した新たなアプローチを提案する。
選択されたsli(deadline hit rate)により、クライアントはサービス要求毎にqosを調整できる。
マルチアクセラレータシステムにおけるディープニューラルネットワークのための新しいオンラインスケジューリングアルゴリズムを提案し,リアルタイム制約を考慮しつつ,テナント毎にモデル固有のqosレベルを保証することに焦点を当てた。
関連論文リスト
- Deep Reinforcement Learning based Online Scheduling Policy for Deep Neural Network Multi-Tenant Multi-Accelerator Systems [1.7724466261976437]
本稿では,マルチテナント環境におけるDNNのオンラインスケジューリングを目的とした低オーバーヘッド深層強化学習アルゴリズムRELMASを提案する。
ヘテロジニアス多加速器システムへのRELMASの適用により、SLAの満足度は最大で173%向上した。
論文 参考訳(メタデータ) (2024-04-13T10:13:07Z) - Large Language Model Meets Graph Neural Network in Knowledge Distillation [7.686812700685084]
サービス指向アーキテクチャにおけるQoS(Quality of Service)を予測するための時間認識フレームワークを提案する。
提案するTOGCLフレームワークは,複数のメトリクスにわたって最先端のメソッドを著しく上回り,最大38.80%の改善を実現している。
論文 参考訳(メタデータ) (2024-02-08T18:33:21Z) - Client Orchestration and Cost-Efficient Joint Optimization for
NOMA-Enabled Hierarchical Federated Learning [55.49099125128281]
半同期クラウドモデルアグリゲーションの下で非直交多重アクセス(NOMA)を実現するHFLシステムを提案する。
提案手法は,HFLの性能改善と総コスト削減に関するベンチマークよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-03T13:34:44Z) - Self-Sustaining Multiple Access with Continual Deep Reinforcement
Learning for Dynamic Metaverse Applications [17.436875530809946]
Metaverseは,さまざまな世界で構成される仮想環境の構築を目的とした,新たなパラダイムだ。
このような動的で複雑なシナリオに対処するためには、自己維持戦略を採用する方法が考えられる。
本稿では,知的エージェントのスループットを最大化するために,マルチチャネル環境におけるマルチアクセスの問題について検討する。
論文 参考訳(メタデータ) (2023-09-18T22:02:47Z) - Elastic Entangled Pair and Qubit Resource Management in Quantum Cloud
Computing [73.7522199491117]
量子クラウドコンピューティング(QCC)は、量子コンピューティングリソースを効率的に提供するための有望なアプローチを提供する。
ユーザ需要の変動と量子回路の要求は、効率的なリソース供給のために困難である。
本稿では、量子コンピューティングとネットワークリソースのプロビジョニングのためのリソース割り当てモデルを提案する。
論文 参考訳(メタデータ) (2023-07-25T00:38:46Z) - Scaling Limits of Quantum Repeater Networks [62.75241407271626]
量子ネットワーク(QN)は、セキュアな通信、強化されたセンシング、効率的な分散量子コンピューティングのための有望なプラットフォームである。
量子状態の脆弱な性質のため、これらのネットワークはスケーラビリティの観点から大きな課題に直面している。
本稿では,量子リピータネットワーク(QRN)のスケーリング限界について解析する。
論文 参考訳(メタデータ) (2023-05-15T14:57:01Z) - A Graph Neural Networks based Framework for Topology-Aware Proactive SLA
Management in a Latency Critical NFV Application Use-case [0.34376560669160383]
5Gと6Gの最近の進歩は、ネットワークシリーズ(NFV)によって実現される遅延クリティカルなアプリケーションの出現につながっている。
本稿では,グラフニューラルネットワーク(GNN)と深層強化学習(DRL)を活用して,効率性と信頼性のトレードオフをバランスさせる,積極的なSLA管理フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-10T23:22:05Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - QoS-Aware Scheduling in New Radio Using Deep Reinforcement Learning [2.3857747529378917]
NRネットワークのためのQA-Aware Deep Reinforcement Learning Agent (QADRA)スケジューラを提案する。
評価シナリオとして,QADRAスケジューラはネットワークのスループットを30%向上すると同時に,ユーザの満足度を同時に維持する。
論文 参考訳(メタデータ) (2021-07-14T09:18:39Z) - Tailored Learning-Based Scheduling for Kubernetes-Oriented Edge-Cloud
System [54.588242387136376]
エッジクラウドシステムのための学習ベースのスケジューリングフレームワークkaisを紹介する。
まず,分散した要求ディスパッチに対応するために,協調型マルチエージェントアクタ-クリティックアルゴリズムを設計する。
次に,多種多様なシステムスケールと構造について,グラフニューラルネットワークを用いてシステム状態情報を埋め込む。
第3に、リクエストディスパッチとサービスオーケストレーションを調和させる2段階のスケジューリングメカニズムを採用します。
論文 参考訳(メタデータ) (2021-01-17T03:45:25Z) - Information Freshness-Aware Task Offloading in Air-Ground Integrated
Edge Computing Systems [49.80033982995667]
本稿では,空域統合マルチアクセスエッジコンピューティングシステムにおける情報更新性を考慮したタスクオフロードの問題について検討する。
サードパーティのリアルタイムアプリケーションサービスプロバイダは、InPからの限られた通信と計算リソースで、加入したモバイルユーザ(MU)にコンピューティングサービスを提供する。
本稿では,各MUに2つの個別の深度Q-networksを適用し,Q-factorと後Q-factorを近似する新しい深度強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-07-15T21:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。