論文の概要: Job Scheduling in Datacenters using Constraint Controlled RL
- arxiv url: http://arxiv.org/abs/2211.05338v1
- Date: Thu, 10 Nov 2022 04:43:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 16:17:14.718207
- Title: Job Scheduling in Datacenters using Constraint Controlled RL
- Title(参考訳): 制約制御RLを用いたデータセンターのジョブスケジューリング
- Authors: Vanamala Venkataswamy
- Abstract要約: 本研究では,グリーンデータセンター環境におけるジョブスケジューリング問題に対して,PID(Proportional-Integral-Derivative)ラグランジアン法を適用した。
実験では、PIDラグランジアン法を使わずにスケジューリングポリシーよりも性能が向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper studies a model for online job scheduling in green datacenters. In
green datacenters, resource availability depends on the power supply from the
renewables. Intermittent power supply from renewables leads to intermittent
resource availability, inducing job delays (and associated costs). Green
datacenter operators must intelligently manage their workloads and available
power supply to extract maximum benefits. The scheduler's objective is to
schedule jobs on a set of resources to maximize the total value (revenue) while
minimizing the overall job delay. A trade-off exists between achieving high job
value on the one hand and low expected delays on the other. Hence, the aims of
achieving high rewards and low costs are in opposition. In addition, datacenter
operators often prioritize multiple objectives, including high system
utilization and job completion. To accomplish the opposing goals of maximizing
total job value and minimizing job delays, we apply the
Proportional-Integral-Derivative (PID) Lagrangian methods in Deep Reinforcement
Learning to job scheduling problem in the green datacenter environment.
Lagrangian methods are widely used algorithms for constrained optimization
problems. We adopt a controls perspective to learn the Lagrange multiplier with
proportional, integral, and derivative control, achieving favorable learning
dynamics. Feedback control defines cost terms for the learning agent, monitors
the cost limits during training, and continuously adjusts the learning
parameters to achieve stable performance. Our experiments demonstrate improved
performance compared to scheduling policies without the PID Lagrangian methods.
Experimental results illustrate the effectiveness of the Constraint Controlled
Reinforcement Learning (CoCoRL) scheduler that simultaneously satisfies
multiple objectives.
- Abstract(参考訳): 本稿では,グリーンデータセンターにおけるオンラインジョブスケジューリングモデルについて検討する。
グリーンデータセンターでは、資源の可用性は再生可能エネルギーからの電力供給に依存する。
再生可能エネルギーからの断続的な電力供給は、断続的なリソース可用性につながり、ジョブ遅延(および関連するコスト)を引き起こす。
グリーンデータセンタオペレータは、ワークロードと利用可能な電源をインテリジェントに管理して、最大のメリットを抽出する必要があります。
スケジューラの目的は、ジョブ全体の遅延を最小限に抑えつつ、リソースのセットでジョブをスケジュールし、総値(復帰)を最大化することである。
一方、高い仕事価値を達成することと、他方が期待する遅延を低くすることとの間にはトレードオフが存在する。
したがって、高い報酬と低いコストを達成するという目的は反対である。
さらに、データセンターオペレータは、高いシステム利用とジョブ完了を含む、複数の目的を優先することが多い。
総ジョブ値の最大化とジョブ遅延の最小化という対向目標を達成するために,グリーンデータセンタ環境におけるジョブスケジューリング問題に対する深層強化学習において,比例積分導関数(pid)ラグランジアン手法を適用する。
ラグランジアン法は制約付き最適化問題のアルゴリズムとして広く用いられている。
我々は、比例、積分、微分制御を伴うラグランジュ乗算法を学習し、良好な学習ダイナミクスを達成するための制御の観点を採用する。
フィードバック制御は、学習エージェントのコスト条件を定義し、トレーニング中のコスト制限を監視し、安定したパフォーマンスを達成するために学習パラメータを継続的に調整する。
PIDラグランジアン法を用いないスケジューリング方式に比べて性能が向上した。
実験結果は,複数の目的を同時に満たす制約制御強化学習(cocorl)スケジューラの有効性を示す。
関連論文リスト
- Goal-Conditioned Terminal Value Estimation for Real-time and Multi-task Model Predictive Control [1.2687745030755995]
マルチタスクポリシー最適化を実現するために,目標条件付き端末値学習を用いたMPCフレームワークを開発した。
提案手法を2足歩行逆振りロボットモデルで評価し,目標条件付き終端値学習と上層軌道プランナーを組み合わせることで,リアルタイムに制御できることを確認する。
論文 参考訳(メタデータ) (2024-10-07T11:19:23Z) - Load Balancing in Federated Learning [3.2999744336237384]
Federated Learning(FL)は、複数のリモートデバイスに分散したデータからの学習を可能にする、分散機械学習フレームワークである。
本稿では,情報時代に基づくスケジューリングポリシーの負荷指標を提案する。
マルコフ連鎖モデルの最適パラメータを確立し、シミュレーションによりアプローチを検証する。
論文 参考訳(メタデータ) (2024-08-01T00:56:36Z) - Characterization of Large Language Model Development in the Datacenter [55.9909258342639]
大きな言語モデル(LLM)は、いくつかの変換タスクにまたがって素晴らしいパフォーマンスを示している。
しかし,大規模クラスタ資源を効率よく利用してLCMを開発することは容易ではない。
我々は,GPUデータセンタAcmeから収集した6ヶ月のLDM開発ワークロードの詳細な評価を行った。
論文 参考訳(メタデータ) (2024-03-12T13:31:14Z) - CUDC: A Curiosity-Driven Unsupervised Data Collection Method with
Adaptive Temporal Distances for Offline Reinforcement Learning [62.58375643251612]
本稿では,Curiosity-driven Unsupervised Data Collection (CUDC)法を提案する。
この適応的な到達性機構により、特徴表現は多様化することができ、エージェントは、好奇心で高品質なデータを集めるために自分自身をナビゲートすることができる。
実験的に、CUDCはDeepMindコントロールスイートの様々なダウンストリームオフラインRLタスクにおいて、既存の教師なし手法よりも効率と学習性能が優れている。
論文 参考訳(メタデータ) (2023-12-19T14:26:23Z) - Dynamic Scheduling for Federated Edge Learning with Streaming Data [56.91063444859008]
我々は,長期的エネルギー制約のある分散エッジデバイスにおいて,トレーニングデータを時間とともにランダムに生成するフェデレーションエッジ学習(FEEL)システムを検討する。
限られた通信リソースとレイテンシ要件のため、各イテレーションでローカルトレーニングプロセスに参加するのはデバイスのサブセットのみである。
論文 参考訳(メタデータ) (2023-05-02T07:41:16Z) - Sustainable AIGC Workload Scheduling of Geo-Distributed Data Centers: A
Multi-Agent Reinforcement Learning Approach [48.18355658448509]
生成的人工知能の最近の進歩は、機械学習トレーニングの需要が急増し、エネルギー消費の大幅な増加によるコスト負担と環境問題を引き起こしている。
地理的に分散したクラウドデータセンタ間でのトレーニングジョブのスケジューリングは、安価で低炭素エネルギーのコンピューティング能力の使用を最適化する機会を浮き彫りにする。
本研究では,実生活におけるワークロードパターン,エネルギー価格,炭素強度を組み込んだクラウドシステムと対話することで,マルチエージェント強化学習とアクタクリティカルな手法に基づく最適協調スケジューリング戦略の学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-17T02:12:30Z) - RARE: Renewable Energy Aware Resource Management in Datacenters [9.488752723308954]
ハイパースケールクラウドプロバイダは、再生可能エネルギーを使用してデータセンターを動かす計画を発表した。
データセンターを動かすために再生可能エネルギーを統合することは、発電が断続的であるため困難である。
再生可能エネルギーからの断続的な電力供給に継続的に適応しつつ、効果的なジョブスケジューリングポリシーを学習するスケジューラを提案する。
論文 参考訳(メタデータ) (2022-11-10T05:17:14Z) - Optimizing Data Collection for Machine Learning [87.37252958806856]
現代のディープラーニングシステムは、素晴らしいパフォーマンスを達成するために巨大なデータセットを必要とします。
過度に収集したデータは不要な現在のコストを発生させる一方、過度に収集したデータは将来のコストと遅延を引き起こす可能性がある。
本稿では,データ収集を形式的最適データ収集問題としてモデル化するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2022-10-03T21:19:05Z) - How Much More Data Do I Need? Estimating Requirements for Downstream
Tasks [99.44608160188905]
小さなトレーニングデータセットと学習アルゴリズムがあれば、ターゲットの検証やテストのパフォーマンスに到達するのに、どれくらいのデータが必要か?
データ要求を過大評価または過小評価すると、十分な予算で回避できる相当なコストが発生する。
本ガイドラインを用いることで,機械学習システムのデータ要求を正確に推定し,開発時間とデータ取得コストの双方で節約することができる。
論文 参考訳(メタデータ) (2022-07-04T21:16:05Z) - ANDREAS: Artificial intelligence traiNing scheDuler foR accElerAted
resource clusterS [1.798617052102518]
パフォーマンスを最大化し、データセンターの運用コストを最小限に抑える高度なスケジューリングソリューションであるANDREASを提案します。
実験の結果,第一原理法では平均で30~62%のコスト削減が可能であった。
論文 参考訳(メタデータ) (2021-05-11T14:36:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。