論文の概要: Capacity Planning and Scheduling for Jobs with Uncertainty in Resource Usage and Duration
- arxiv url: http://arxiv.org/abs/2507.01225v1
- Date: Tue, 01 Jul 2025 22:56:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.954228
- Title: Capacity Planning and Scheduling for Jobs with Uncertainty in Resource Usage and Duration
- Title(参考訳): 資源使用量・期間の不確実性のある雇用者の容量計画とスケジューリング
- Authors: Sunandita Patra, Mehtab Pathan, Mahmoud Mahfouz, Parisa Zehtabi, Wided Ouaja, Daniele Magazzeni, Manuela Veloso,
- Abstract要約: この作業は、オンデマンドグリッドコンピューティング環境におけるキャパシティ計画、リソース要求の推定、ジョブスケジューリングを実行することである。
このアプローチの重要な貢献は、リソース使用量とジョブの持続時間の両方において不確実性を扱うことです。
決定論的推定器とペアサンプリングに基づく制約プログラミングを用いた近似手法を提案する。
- 参考スコア(独自算出の注目度): 11.232441969983672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Organizations around the world schedule jobs (programs) regularly to perform various tasks dictated by their end users. With the major movement towards using a cloud computing infrastructure, our organization follows a hybrid approach with both cloud and on-prem servers. The objective of this work is to perform capacity planning, i.e., estimate resource requirements, and job scheduling for on-prem grid computing environments. A key contribution of our approach is handling uncertainty in both resource usage and duration of the jobs, a critical aspect in the finance industry where stochastic market conditions significantly influence job characteristics. For capacity planning and scheduling, we simultaneously balance two conflicting objectives: (a) minimize resource usage, and (b) provide high quality-of-service to the end users by completing jobs by their requested deadlines. We propose approximate approaches using deterministic estimators and pair sampling-based constraint programming. Our best approach (pair sampling-based) achieves much lower peak resource usage compared to manual scheduling without compromising on the quality-of-service.
- Abstract(参考訳): 世界中の組織が定期的にジョブ(プログラム)をスケジュールし、エンドユーザによって指示されたさまざまなタスクを実行します。
クラウドコンピューティングインフラストラクチャの利用に向けた大きな動きとして、当社の組織は、クラウドとオンプレミスの両方のサーバによるハイブリッドアプローチを採用しています。
本研究の目的は、オン・プレム・グリッド・コンピューティング環境における容量計画、すなわち、リソース要求の推定とジョブスケジューリングを行うことである。
当社のアプローチにおける重要な貢献は、資源使用量と雇用期間の両面での不確実性に対処することであり、確率的市場条件が雇用特性に著しく影響を及ぼす金融業界における重要な側面である。
キャパシティ計画とスケジューリングのために、私たちは2つの相反する目標を同時にバランスさせます。
(a)資源使用量を最小限にし、
(b)要求期限までにジョブを完了させることにより、エンドユーザに高品質なサービスを提供すること。
決定論的推定器とペアサンプリングに基づく制約プログラミングを用いた近似手法を提案する。
当社のベストアプローチ(ペアサンプリングベース)は,サービス品質を損なうことなく,手作業によるスケジューリングよりもはるかに低いピークリソース使用率を実現しています。
関連論文リスト
- Semantic Scheduling for LLM Inference [48.19648297172146]
大規模言語モデル(LLM)からの要求のスケジューリングにおける意味的スケジューリングの概念を導入する。
LLMベースのプロンプトスケジューリングにおいて、全体の待ち時間を最小化するために、最適な時間複雑性を持つ新しいスケジューリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-13T20:15:58Z) - An Advanced Reinforcement Learning Framework for Online Scheduling of Deferrable Workloads in Cloud Computing [37.457951933256055]
クラウド上でのdeferrableジョブのためのtextitOnline Scheduling(OSDEC)と呼ばれるオンラインのdeferrableジョブスケジューリング手法を提案する。
提案手法は,高資源利用率を維持しつつ,デプロイメントスケジュールを適切に計画し,ユーザの待ち時間を短縮することができる。
論文 参考訳(メタデータ) (2024-06-03T06:55:26Z) - Dynamic Scheduling for Federated Edge Learning with Streaming Data [56.91063444859008]
我々は,長期的エネルギー制約のある分散エッジデバイスにおいて,トレーニングデータを時間とともにランダムに生成するフェデレーションエッジ学習(FEEL)システムを検討する。
限られた通信リソースとレイテンシ要件のため、各イテレーションでローカルトレーニングプロセスに参加するのはデバイスのサブセットのみである。
論文 参考訳(メタデータ) (2023-05-02T07:41:16Z) - Job Scheduling in Datacenters using Constraint Controlled RL [0.0]
本研究では,グリーンデータセンター環境におけるジョブスケジューリング問題に対して,PID(Proportional-Integral-Derivative)ラグランジアン法を適用した。
実験では、PIDラグランジアン法を使わずにスケジューリングポリシーよりも性能が向上した。
論文 参考訳(メタデータ) (2022-11-10T04:43:14Z) - MetaNet: Automated Dynamic Selection of Scheduling Policies in Cloud
Environments [13.864161788250856]
本研究の目的は,MetaNetと呼ばれる代理モデルを用いてスケジューリングポリシーのオンライン動的選択という,非自明なメタ問題を解決することである。
最先端のDNNスケジューラと比較して、実行コスト、エネルギー消費、応答時間、サービスレベルの合意違反を最大11, 43, 8, 13パーセント改善することができる。
論文 参考訳(メタデータ) (2022-05-21T16:51:51Z) - Innovations in the field of on-board scheduling technologies [64.41511459132334]
本稿では、ミッション自律のためのソフトウェアフレームワークに組み込まれた、オンボードスケジューラを提案する。
スケジューラは線形整数プログラミングに基づいており、ブランチ・アンド・カット・ソルバの使用に依存している。
この技術は地球観測のシナリオでテストされており、その性能を最先端のスケジューリング技術と比較している。
論文 参考訳(メタデータ) (2022-05-04T12:00:49Z) - MCDS: AI Augmented Workflow Scheduling in Mobile Edge Cloud Computing
Systems [12.215537834860699]
近年,エッジコンピューティングプラットフォームの低応答時間を利用してアプリケーション品質・オブ・サービス(QoS)を最適化するスケジューリング手法が提案されている。
本稿では,Deep Surrogate Models を用いたモンテカルロ学習を用いて,モバイルエッジクラウドコンピューティングシステムにおけるワークフローアプリケーションを効率的にスケジューリングする手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T10:00:01Z) - Meta-learning with an Adaptive Task Scheduler [93.63502984214918]
既存のメタ学習アルゴリズムは、一様確率でランダムにメタトレーニングタスクをサンプリングする。
タスクは、限られた数のメタトレーニングタスクを考えると、ノイズや不均衡に有害である可能性が高い。
メタトレーニングプロセスのための適応タスクスケジューラ(ATS)を提案する。
論文 参考訳(メタデータ) (2021-10-26T22:16:35Z) - Should We Be Pre-training? An Argument for End-task Aware Training as an
Alternative [88.11465517304515]
一般に、事前学習のステップは、モデルを微調整するタスクについて、ほとんど、あるいは全く直接の知識に依存しない。
エンドタスクと補助目的をマルチタスクすることで、ダウンストリームタスクのパフォーマンスが大幅に向上することを示す。
論文 参考訳(メタデータ) (2021-09-15T17:13:18Z) - A Predictive Autoscaler for Elastic Batch Jobs [8.354712625979776]
Deep Learning、HPC、Sparkといった大規模なバッチジョブは、従来のオンラインサービスよりもはるかに多くの計算リソースとコストを必要とします。
顧客とオーバプロビジョンインスタンスに対して,柔軟なインターフェースを提供するための予測オートスケーラを提案する。
論文 参考訳(メタデータ) (2020-10-10T17:35:55Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。