論文の概要: Towards VM Rescheduling Optimization Through Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2505.17359v1
- Date: Fri, 23 May 2025 00:30:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.744954
- Title: Towards VM Rescheduling Optimization Through Deep Reinforcement Learning
- Title(参考訳): 深層強化学習によるVM再スケジューリング最適化に向けて
- Authors: Xianzhong Ding, Yunkai Zhang, Binbin Chen, Donghao Ying, Tieying Zhang, Jianjun Chen, Lei Zhang, Alberto Cerpa, Wan Du,
- Abstract要約: 我々は,VM再スケジュールのための強化学習システムVM2RLを開発した。
その結果,VM2RLは最適解に匹敵する性能を達成できるが,実行時間は数秒であることがわかった。
- 参考スコア(独自算出の注目度): 9.4293010682986
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Modern industry-scale data centers need to manage a large number of virtual machines (VMs). Due to the continual creation and release of VMs, many small resource fragments are scattered across physical machines (PMs). To handle these fragments, data centers periodically reschedule some VMs to alternative PMs, a practice commonly referred to as VM rescheduling. Despite the increasing importance of VM rescheduling as data centers grow in size, the problem remains understudied. We first show that, unlike most combinatorial optimization tasks, the inference time of VM rescheduling algorithms significantly influences their performance, due to dynamic VM state changes during this period. This causes existing methods to scale poorly. Therefore, we develop a reinforcement learning system for VM rescheduling, VM2RL, which incorporates a set of customized techniques, such as a two-stage framework that accommodates diverse constraints and workload conditions, a feature extraction module that captures relational information specific to rescheduling, as well as a risk-seeking evaluation enabling users to optimize the trade-off between latency and accuracy. We conduct extensive experiments with data from an industry-scale data center. Our results show that VM2RL can achieve a performance comparable to the optimal solution but with a running time of seconds. Code and datasets are open-sourced: https://github.com/zhykoties/VMR2L_eurosys, https://drive.google.com/drive/folders/1PfRo1cVwuhH30XhsE2Np3xqJn2GpX5qy.
- Abstract(参考訳): 現代の産業規模のデータセンターは、多数の仮想マシン(VM)を管理する必要がある。
VMの連続的な生成とリリースのため、多くの小さなリソースフラグメントが物理マシン(PM)に分散している。
これらのフラグメントを処理するために、データセンターは定期的に一部のVMを代替のPMに再スケジュールする。
データセンターのサイズが大きくなるにつれて、VMの再スケジュールの重要性が増しているにもかかわらず、問題は未検討のままである。
まず、ほとんどの組合せ最適化タスクとは異なり、VM再スケジューリングアルゴリズムの推論時間は、この期間の動的VM状態の変化により、その性能に大きく影響することを示した。
これにより既存のメソッドのスケールが低下する。
そこで本研究では,VM再スケジューリングのための強化学習システムであるVM2RLを開発し,多様な制約やワークロード条件を満たす2段階フレームワーク,リスケジュールに特有の関係情報をキャプチャする機能抽出モジュール,レイテンシと精度のトレードオフを最適化可能なリスク検索評価など,一連のカスタマイズ技術を開発した。
産業規模のデータセンターからのデータによる広範な実験を行う。
その結果,VM2RLは最適解に匹敵する性能を達成できるが,実行時間は数秒であることがわかった。
https://github.com/zhykoties/VMR2L_eurosys, https://drive.google.com/drive/folders/1PfRo1cVwuhH30XhsE2Np3xqJn2GpX5qy。
関連論文リスト
- Enhancing Robustness and Efficiency of Least Square Twin SVM via Granular Computing [0.2999888908665658]
機械学習の分野では、最小二乗サポートベクターマシン(LSTSVM)が最先端モデルの1つとして際立っている。
LSTSVMはノイズやインバージョンに対する感受性に悩まされており、リサンプリングの原則と不安定さを見落としている。
そこで我々は,従来のデータポイントの代わりに粒状球を用いて学習した,頑健な粒状球 LSTSVM (GBLSTSVM) を提案する。
論文 参考訳(メタデータ) (2024-10-22T18:13:01Z) - vTensor: Flexible Virtual Tensor Management for Efficient LLM Serving [53.972175896814505]
大規模言語モデル(LLM)は様々なドメインで広く使われ、数百万の日次要求を処理する。
大規模言語モデル(LLM)は様々なドメインで広く使われ、数百万の日次要求を処理する。
論文 参考訳(メタデータ) (2024-07-22T14:37:58Z) - In Situ Framework for Coupling Simulation and Machine Learning with
Application to CFD [51.04126395480625]
近年、流体力学計算を容易にする機械学習(ML)の多くの成功例が報告されている。
シミュレーションが大きくなるにつれて、従来のオフライン学習のための新しいトレーニングデータセットの生成は、I/Oとストレージのボトルネックを生み出します。
この作業は、この結合を単純化し、異種クラスタでのその場トレーニングと推論を可能にするソリューションを提供する。
論文 参考訳(メタデータ) (2023-06-22T14:07:54Z) - Recipe for Fast Large-scale SVM Training: Polishing, Parallelism, and
more RAM! [0.0]
サポートベクタマシン(SVM)は、機械学習ツールボックスの標準メソッドである。
しかし、非線形カーネルSVMは、長いトレーニング時間に費やして、高い精度の予測器を提供することが多い。
本研究では,2つのアプローチを組み合わせて,超高速なデュアルSVMソルバを設計する。
論文 参考訳(メタデータ) (2022-07-03T11:51:41Z) - Asynchronous Parallel Incremental Block-Coordinate Descent for
Decentralized Machine Learning [55.198301429316125]
機械学習(ML)は、巨大なIoT(Internet of Things)ベースのインテリジェントでユビキタスなコンピューティングのビッグデータ駆動モデリングと分析のための重要なテクニックである。
急成長するアプリケーションやデータ量にとって、分散学習は有望な新興パラダイムである。
本稿では,多くのユーザデバイスに分散した分散システム上でMLモデルをトレーニングする問題について検討する。
論文 参考訳(メタデータ) (2022-02-07T15:04:15Z) - VMAgent: Scheduling Simulator for Reinforcement Learning [44.026076801936874]
VMAgentと呼ばれる新しいシミュレータは、RL研究者が新しい手法をよりよく探求するのに役立つ。
VMAgentは、実用的な仮想マシン(VM)スケジューリングタスクにインスパイアされている。
VMスケジューリングの観点からは、VMAgentは学習ベースのスケジューリングソリューションの改善にも役立ちます。
論文 参考訳(メタデータ) (2021-12-09T09:18:38Z) - Dynamic Network-Assisted D2D-Aided Coded Distributed Learning [59.29409589861241]
本稿では,デバイス間のロードバランシングのための新しいデバイス・ツー・デバイス(D2D)支援型符号化学習手法(D2D-CFL)を提案する。
最小処理時間を達成するための最適圧縮率を導出し、収束時間との接続を確立する。
提案手法は,ユーザが継続的にトレーニングデータを生成するリアルタイム協調アプリケーションに有用である。
論文 参考訳(メタデータ) (2021-11-26T18:44:59Z) - AML-SVM: Adaptive Multilevel Learning with Support Vector Machines [0.0]
本稿では非線形SVMのための適応型多段階学習フレームワークを提案する。
改良プロセス全体の分類品質を改善し、マルチスレッド並列処理を活用して性能を向上する。
論文 参考訳(メタデータ) (2020-11-05T00:17:02Z) - On Coresets for Support Vector Machines [61.928187390362176]
coresetは、元のデータポイントの小さな、代表的なサブセットである。
我々は,本アルゴリズムを用いて,既製のSVMソルバをストリーミング,分散,動的データ設定に適用可能であることを示す。
論文 参考訳(メタデータ) (2020-02-15T23:25:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。