論文の概要: Decentralized Task Scheduling in Distributed Systems: A Deep Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2603.24738v1
- Date: Wed, 25 Mar 2026 18:59:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:47.950055
- Title: Decentralized Task Scheduling in Distributed Systems: A Deep Reinforcement Learning Approach
- Title(参考訳): 分散システムにおける分散タスクスケジューリング:深層強化学習アプローチ
- Authors: Daniel Benniah John,
- Abstract要約: 本稿では,分散システムにおけるタスクスケジューリングのための分散型マルチエージェント深層強化学習フレームワークを提案する。
離散化された部分観測可能決定マルコフ過程(Dec-POMDP)として問題を定式化する。
我々は,NumPyのみを用いて実装された軽量アクタクリティカルアーキテクチャを開発し,リソース制約されたエッジデバイスへの展開を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient task scheduling in large-scale distributed systems presents significant challenges due to dynamic workloads, heterogeneous resources, and competing quality-of-service requirements. Traditional centralized approaches face scalability limitations and single points of failure, while classical heuristics lack adaptability to changing conditions. This paper proposes a decentralized multi-agent deep reinforcement learning (DRL-MADRL) framework for task scheduling in heterogeneous distributed systems. We formulate the problem as a Decentralized Partially Observable Markov Decision Process (Dec-POMDP) and develop a lightweight actor-critic architecture implemented using only NumPy, enabling deployment on resource-constrained edge devices without heavyweight machine learning frameworks. Using workload characteristics derived from the publicly available Google Cluster Trace dataset, we evaluate our approach on a 100-node heterogeneous system processing 1,000 tasks per episode over 30 experimental runs. Experimental results demonstrate 15.6% improvement in average task completion time (30.8s vs 36.5s for random baseline), 15.2% energy efficiency gain (745.2 kWh vs 878.3 kWh), and 82.3% SLA satisfaction compared to 75.5% for baselines, with all improvements statistically significant (p < 0.001). The lightweight implementation requires only NumPy, Matplotlib, and SciPy. Complete source code and experimental data are provided for full reproducibility at https://github.com/danielbenniah/marl-distributed-scheduling.
- Abstract(参考訳): 大規模分散システムにおける効率的なタスクスケジューリングは、動的ワークロード、異種リソース、競合するサービス品質要件による重大な課題を呈する。
従来の集中型アプローチではスケーラビリティの制限と単一障害点に直面するが、古典的ヒューリスティックでは条件の変更への適応性が欠如している。
異種分散システムにおけるタスクスケジューリングのための分散型マルチエージェント深部強化学習(DRL-MADRL)フレームワークを提案する。
我々は、分散化された部分観測可能なマルコフ決定プロセス(Dec-POMDP)として問題を定式化し、NumPyのみを使用して実装された軽量アクター批判アーキテクチャを開発し、重み付き機械学習フレームワークを使わずにリソース制約されたエッジデバイスへのデプロイを可能にする。
公開されているGoogle Cluster Traceデータセットから得られたワークロード特性を用いて、実験的な30回に1回1000タスクを処理する100ノードの異種システムに対するアプローチを評価した。
実験の結果、平均タスク完了時間の15.6%の改善(ランダムベースラインでは36.5秒対36.5秒)、15.2%のエネルギー効率向上(745.2kWh対878.3kWh)、82.3%のSLA満足度(ベースラインでは75.5%、統計的に有意な改善(p < 0.001)が示された。
軽量な実装には、NumPy、Matplotlib、SciPyのみが必要である。
完全なソースコードと実験データはhttps://github.com/danielbenniah/marl-distributed-scheduling.comで完全な再現性を提供する。
関連論文リスト
- DeFRiS: Silo-Cooperative IoT Applications Scheduling via Decentralized Federated Reinforcement Learning [62.347535250646196]
本稿では、ロバストでスケーラブルなシロコラボ型IoTアプリケーションスケジューリングのための分散フェデレーション強化学習フレームワークであるDeFRiSを提案する。
DeFRiSは、(i)異種サイロ間のシームレスな知識伝達を可能にするための候補資源スコアを利用したアクション空間非依存ポリシー、(ii)汎用アドバンテージ推定とクリッピングされたポリシー更新を組み合わせたサイロ最適化ローカル学習メカニズム、(iii)類似性認識の知識伝達と異常検出に勾配指紋を利用するDual-Track Non-IIDロバストな分散集約プロトコル、の3つのイノベーションを統合する。
論文 参考訳(メタデータ) (2026-03-16T02:02:38Z) - ODAR: Principled Adaptive Routing for LLM Reasoning via Active Inference [60.958331943869126]
ODAR-Expertは、原則化されたリソース割り当てによる精度と効率のトレードオフを最適化する適応的なルーティングフレームワークである。
我々は、MATHの98.2%の精度、HumanityのLast Examの54.8%を含む、強く一貫した利得を示している。
論文 参考訳(メタデータ) (2026-02-27T05:22:01Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Slim Scheduler: A Runtime-Aware RL and Scheduler System for Efficient CNN Inference [0.0]
Slim Schedulerは、PPO(Proximal Policy Optimization)強化学習ポリシーとアルゴリズム的、欲求的なスケジューラを統合し、スクリム可能なモデルに対する分散推論を調整する。
この階層的な設計は、検索空間の複雑さを減らし、特定のハードウェアへの過度な適合を緩和し、効率とスループットのバランスをとる。
論文 参考訳(メタデータ) (2025-10-10T05:44:05Z) - Multi-Agent Reinforcement Learning for Sample-Efficient Deep Neural Network Mapping [54.65536245955678]
本稿では,サンプル非効率性の課題を克服するために,分散型マルチエージェント強化学習(MARL)フレームワークを提案する。
相関解析に基づいて類似のマッピングパラメータを同一エージェントに割り当てるエージェントクラスタリングアルゴリズムを提案する。
実験の結果,MARL法は標準単エージェントRLよりも30~300倍効率が向上した。
論文 参考訳(メタデータ) (2025-07-22T05:51:07Z) - Rack Position Optimization in Large-Scale Heterogeneous Data Centers [38.59029729507364]
本稿では,局所探索のための低レベル勾配に基づく高レベル深部強化学習(DRL)モデルを用いた新しい2層最適化フレームワークを提案する。
高レベルのDRLエージェントは、Lead Rewardを最適ラック型順序付けに使用し、低レベルの効率的な位置マップ、移動回数の最小化、耐故障性資源分布の確保を行う。
当社のアルゴリズムは,大規模データセンタ管理に不可欠な,安定的で効率的な結果を継続的に提供しています。
論文 参考訳(メタデータ) (2025-03-31T22:55:37Z) - MAGNNET: Multi-Agent Graph Neural Network-based Efficient Task Allocation for Autonomous Vehicles with Deep Reinforcement Learning [2.5022287664959446]
本稿では,グラフニューラルネットワーク(GNN)を一元的トレーニングと分散実行(CTDE)パラダイムに統合する新しいフレームワークを提案する。
本手法により,無人航空機 (UAV) と無人地上車両 (UGV) は, 中央調整を必要とせず, 効率よくタスクを割り当てることができる。
論文 参考訳(メタデータ) (2025-02-04T13:29:56Z) - FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。
CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。
CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - End-to-end Adaptive Distributed Training on PaddlePaddle [10.855328649169293]
分散トレーニングフレームワークを体系的なエンドツーエンドのビューで設計し、さまざまなシナリオに適応機能を提供する。
統一分散グラフと統一クラスタオブジェクトに基づいて,我々の適応型フレームワークは,グローバルコストモデルとグローバルプランナを備えている。
実験により、我々のフレームワークはアプリケーションの多様性から様々な要件を満たすことができることが示された。
論文 参考訳(メタデータ) (2021-12-06T03:00:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。