論文の概要: iScheduler: Reinforcement Learning-Driven Continual Optimization for Large-Scale Resource Investment Problems
- arxiv url: http://arxiv.org/abs/2602.06064v1
- Date: Fri, 30 Jan 2026 11:20:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.015632
- Title: iScheduler: Reinforcement Learning-Driven Continual Optimization for Large-Scale Resource Investment Problems
- Title(参考訳): iScheduler: 大規模資源投資問題に対する強化学習駆動型継続的最適化
- Authors: Yi-Xiang Hu, Yuke Wang, Feng Wu, Zirui Huang, Shuli Zeng, Xiang-Yang Li,
- Abstract要約: 共有再生資源下での事前制約されたタスクのスケジューリングは、現代のコンピューティングプラットフォームの中心である。
強化学習駆動型反復スケジューリングフレームワークiSchedulerを提案する。
実験の結果、iSchedulerは競争力のあるリソースコストを得ると同時に、強力な商用ベースラインに対して最大43$timesの時間で実現可能であることがわかった。
- 参考スコア(独自算出の注目度): 30.109981943437006
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scheduling precedence-constrained tasks under shared renewable resources is central to modern computing platforms. The Resource Investment Problem (RIP) models this setting by minimizing the cost of provisioned renewable resources under precedence and timing constraints. Exact mixed-integer programming and constraint programming become impractically slow on large instances, and dynamic updates require schedule revisions under tight latency budgets. We present iScheduler, a reinforcement-learning-driven iterative scheduling framework that formulates RIP solving as a Markov decision process over decomposed subproblems and constructs schedules through sequential process selection. The framework accelerates optimization and supports reconfiguration by reusing unchanged process schedules and rescheduling only affected processes. We also release L-RIPLIB, an industrial-scale benchmark derived from cloud-platform workloads with 1,000 instances of 2,500-10,000 tasks. Experiments show that iScheduler attains competitive resource costs while reducing time to feasibility by up to 43$\times$ against strong commercial baselines.
- Abstract(参考訳): 共有再生資源下での事前制約されたタスクのスケジューリングは、現代のコンピューティングプラットフォームの中心である。
資源投資問題(RIP)はこの設定を、優先順位とタイミング制約の下で供給された再生可能資源のコストを最小化することでモデル化する。
厳格な混合整数プログラミングと制約プログラミングは大規模インスタンスでは不規則に遅くなり、動的更新は厳格な遅延予算の下でスケジュール修正を必要とする。
iSchedulerは強化学習駆動型反復スケジューリングフレームワークで、分解されたサブプロブレム上のマルコフ決定プロセスとしてRIP解決を定式化し、逐次プロセス選択によってスケジュールを構築する。
このフレームワークは最適化を加速し、変更のないプロセススケジュールを再利用し、影響を受けるプロセスのみを再スケジュールすることで再構成をサポートする。
L-RIPLIBもリリースしました。これは、2500-10,000タスクの1,000インスタンスのクラウドプラットフォームワークロードから派生した、産業規模のベンチマークです。
実験の結果、iSchedulerは競争力のあるリソースコストを達成しつつ、強力な商用ベースラインに対して最大43$\times$で実現可能であることがわかった。
関連論文リスト
- CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。
提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2025-08-15T07:49:22Z) - Scalable Chain of Thoughts via Elastic Reasoning [61.75753924952059]
Elastic Reasoningは、スケーラブルな思考の連鎖のための新しいフレームワークである。
推論は、独立して割り当てられた予算で、思考と解決の2つのフェーズに分けられる。
我々のアプローチは、制約のない設定でもより簡潔で効率的な推論をもたらす。
論文 参考訳(メタデータ) (2025-05-08T15:01:06Z) - OmniRouter: Budget and Performance Controllable Multi-LLM Routing [31.60019342381251]
大規模言語モデル(LLM)は優れた性能を提供するが、かなりの計算資源を必要とし、比較的低効率で運用する。
マルチLLMサービスのための制御可能なルーティングフレームワークであるOmniを紹介する。
実験の結果、Omniは応答精度を最大6.30%改善し、同時に計算コストを少なくとも10.15%削減した。
論文 参考訳(メタデータ) (2025-02-27T22:35:31Z) - Dynamic Scheduling for Federated Edge Learning with Streaming Data [56.91063444859008]
我々は,長期的エネルギー制約のある分散エッジデバイスにおいて,トレーニングデータを時間とともにランダムに生成するフェデレーションエッジ学習(FEEL)システムを検討する。
限られた通信リソースとレイテンシ要件のため、各イテレーションでローカルトレーニングプロセスに参加するのはデバイスのサブセットのみである。
論文 参考訳(メタデータ) (2023-05-02T07:41:16Z) - Generating Dispatching Rules for the Interrupting Swap-Allowed Blocking
Job Shop Problem Using Graph Neural Network and Reinforcement Learning [21.021840570685264]
割り込みスワップ可能なブロッキングジョブショップ問題(ISBJSSP)は、多くの製造計画やロジスティクスアプリケーションを現実的にモデル化することができる。
連続的な削除や加算を受けるノードとエッジを特徴とする動的解離グラフの定式化を導入する。
ISBJSSP設定の割り込み、スワップ、ブロッキングをシミュレートするシミュレータが開発された。
論文 参考訳(メタデータ) (2023-02-05T23:35:21Z) - Actively Learning Costly Reward Functions for Reinforcement Learning [56.34005280792013]
複雑な実世界の環境でエージェントを訓練することは、桁違いに高速であることを示す。
強化学習の手法を新しい領域に適用することにより、興味深く非自明な解を見つけることができることを示す。
論文 参考訳(メタデータ) (2022-11-23T19:17:20Z) - MetaNet: Automated Dynamic Selection of Scheduling Policies in Cloud
Environments [13.864161788250856]
本研究の目的は,MetaNetと呼ばれる代理モデルを用いてスケジューリングポリシーのオンライン動的選択という,非自明なメタ問題を解決することである。
最先端のDNNスケジューラと比較して、実行コスト、エネルギー消費、応答時間、サービスレベルの合意違反を最大11, 43, 8, 13パーセント改善することができる。
論文 参考訳(メタデータ) (2022-05-21T16:51:51Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。