論文の概要: Duration-Informed Workload Scheduler
- arxiv url: http://arxiv.org/abs/2604.09599v1
- Date: Sat, 07 Mar 2026 17:53:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.535504
- Title: Duration-Informed Workload Scheduler
- Title(参考訳): Duration-Informed Workload Scheduler
- Authors: Daniela Loreti, Davide Leone, Andrea Borghesi,
- Abstract要約: 機械学習によって構築された時間予測モジュールで拡張されたワークロードスケジューラを開発する。
本稿では,Tier-0スーパーコンピュータのワークロードトレースを用いて,全ジョブの平均待ち時間を約11%削減したことを示す。
待ち時間の短縮は、ユーザの視点からのサービス品質の向上と、システムの観点からのターンアラウンドに直結する。
- 参考スコア(独自算出の注目度): 2.0263791972068628
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-performance computing systems are complex machines whose behaviour is governed by the correct functioning of its many subsystems. Among these, the workload scheduler has a crucial impact on the timely execution of the jobs continuously submitted to the computing resources. Making high-quality scheduling decisions is contingent on knowing the duration of submitted jobs before their execution--a non-trivial task for users that can be tackled with Machine Learning. In this work, we devise a workload scheduler enhanced with a duration prediction module built via Machine Learning. We evaluate its effectiveness and show its performance using workload traces from a Tier-0 supercomputer, demonstrating a decrease in mean waiting time across all jobs of around 11%. Lower waiting times are directly connected to better quality of service from the users' point of view and higher turnaround from the system's perspective.
- Abstract(参考訳): 高性能コンピューティングシステムは、多くのサブシステムの正しい機能によって制御される複雑なマシンである。
これらのうち、ワークロードスケジューラは、コンピュータリソースに継続的に送信されるジョブのタイムリーな実行に決定的な影響を与える。
高品質なスケジューリング決定を行うには、実行前に提出されたジョブの期間を知る必要がある。
本研究では,機械学習によって構築された継続時間予測モジュールによって拡張されたワークロードスケジューラを考案する。
我々は、Tier-0スーパーコンピュータのワークロードトレースを用いて、その性能を評価し、全ジョブの平均待ち時間を約11%削減したことを示す。
待ち時間の短縮は、ユーザの視点からのサービス品質の向上と、システムの観点からのターンアラウンドに直結する。
関連論文リスト
- Semantic-Aware Scheduling for GPU Clusters with Large Language Models [60.14838697778884]
我々は、スケジューラと管理するジョブ間のセマンティックギャップを橋渡しするフレームワークであるSchedMateを提案する。
SchedMateは見過ごされ、構造化されていないデータソース(ソースコード、ランタイムログ、履歴ジョブ)から深い洞察を抽出する。
我々は、SchedMateが平均ジョブ完了時間を最大1.91倍に短縮し、スケジューリング性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2025-10-02T02:01:02Z) - Robust Speech-Workload Estimation for Intelligent Human-Robot Systems [0.0]
オペレータのワークロード状態の変化に対応するシステムの要求と相互作用のインテリジェントな変調は、望ましくないワークロード状態を避けることによってパフォーマンスを向上させる可能性がある。
既存のワークロードシステムは、ポストホックの後に複数のワークロードコンポーネントを見積もるが、音声のワークロードや関数をリアルタイムで見積もることは少ない。
音声作業負荷と望ましくない作業負荷状態をリアルタイムに推定するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-07-08T13:41:59Z) - ATA: Adaptive Task Allocation for Efficient Resource Management in Distributed Machine Learning [54.08906841213777]
非同期手法は分散機械学習における計算の並列化の基礎となる。
本稿では,不均一かつランダムな計算時間分布に適応するATA(Adaptive Task Allocation)を提案する。
ATAは最適なタスク割り当てを識別し、計算時間に関する事前の知識を持つメソッドと互換性があることを示す。
論文 参考訳(メタデータ) (2025-02-02T12:22:26Z) - An Advanced Reinforcement Learning Framework for Online Scheduling of Deferrable Workloads in Cloud Computing [37.457951933256055]
クラウド上でのdeferrableジョブのためのtextitOnline Scheduling(OSDEC)と呼ばれるオンラインのdeferrableジョブスケジューリング手法を提案する。
提案手法は,高資源利用率を維持しつつ,デプロイメントスケジュールを適切に計画し,ユーザの待ち時間を短縮することができる。
論文 参考訳(メタデータ) (2024-06-03T06:55:26Z) - Third-Party Language Model Performance Prediction from Instruction [59.574169249307054]
言語モデルに基づく命令フォローシステムは、最近、多くのベンチマークタスクのパフォーマンスが向上している。
ユーザは、応答が正確かどうかを判断することなく、命令付きモデルを容易に促すことができる。
本稿では,タスク上での指示追従システムの評価から得られたメトリックを予測するために,別のモデルを訓練した第三者のパフォーマンス予測フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-19T03:53:47Z) - Acela: Predictable Datacenter-level Maintenance Job Scheduling [27.990173338574138]
本稿では,維持作業期間を予測する機械学習システムであるAcelaを紹介する。
Acela はオフラインのサーバ数を 1.87-4.28X に減らし,サーバのオフライン時間を 1.40-2.80X に減らした。
論文 参考訳(メタデータ) (2022-12-10T00:22:49Z) - Music Instrument Classification Reprogrammed [79.68916470119743]
プログラム」とは、事前学習されたモデルの入力と出力の両方を修正・マッピングすることで、もともと異なるタスクをターゲットにした、事前学習された深層・複雑なニューラルネットワークを利用する手法である。
本研究では,異なるタスクで学習した表現のパワーを効果的に活用できることを実証し,結果として得られた再プログラムシステムは,訓練パラメータのごく一部で,同等あるいはそれ以上の性能を持つシステムでも実行可能であることを実証する。
論文 参考訳(メタデータ) (2022-11-15T18:26:01Z) - Lifelong Learning Metrics [63.8376359764052]
DARPA Lifelong Learning Machines (L2M) プログラムは、人工知能(AI)システムの進歩を目指している。
本論文は、生涯学習シナリオを実行するエージェントのパフォーマンスの構築と特徴付けのためのフォーマリズムを概説する。
論文 参考訳(メタデータ) (2022-01-20T16:29:14Z) - Scheduling Real-time Deep Learning Services as Imprecise Computations [11.611969843191433]
本稿では,インテリジェントリアルタイムエッジサービスのための効率的なリアルタイムスケジューリングアルゴリズムを提案する。
これらのサービスは、音声認識、LIDAR処理、マシンビジョンなどのマシンインテリジェンスタスクを実行する。
ディープニューラルネットワークを不正確な計算として、それぞれに必須部分といくつかのオプション部分を持つことを示す。
論文 参考訳(メタデータ) (2020-11-02T16:43:04Z) - Temporally Correlated Task Scheduling for Sequence Learning [143.70523777803723]
多くのアプリケーションにおいて、シーケンス学習タスクは通常、複数の時間的に相関した補助タスクと関連付けられている。
シーケンス学習に学習可能なスケジューラを導入し、トレーニングのための補助的なタスクを適応的に選択できる。
本手法は,同時翻訳とストックトレンド予測の性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-07-10T10:28:54Z) - Sequence-to-sequence models for workload interference [1.988145627448243]
データセンターでのジョブのスケジューリングは難しいシナリオであり、ジョブは厳しいスローダウンや実行の失敗につながるリソースを競うことができる。
現在のテクニックは、多くが機械学習とジョブモデリングを含むもので、時間にわたってワークロードの振る舞いを要約に基づいている。
本稿では,リソースや実行時間に対する行動に基づいて,データセンタ上でのジョブの協調スケジューリングをモデル化する手法を提案する。
論文 参考訳(メタデータ) (2020-06-25T14:11:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。