論文の概要: Accelerating Divisible Load Processing Through Machine Learning: A Practical Framework for Large-Scale Workloads
- arxiv url: http://arxiv.org/abs/2605.23247v1
- Date: Fri, 22 May 2026 05:31:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.211638
- Title: Accelerating Divisible Load Processing Through Machine Learning: A Practical Framework for Large-Scale Workloads
- Title(参考訳): 機械学習による多様な負荷処理の高速化 - 大規模ワークロードのための実践的フレームワーク
- Authors: Bharadwaj Veeravalli,
- Abstract要約: 単一レベルツリーネットワーク(SLTN)アーキテクチャにおいて、最適な処理時間を予測するための最初の機械学習フレームワークを紹介する。
我々は10万の合成された構成のモデルを訓練し、可除負荷理論方程式の明示的な定式化なしに最適な処理時間を予測した。
このモデルでは、97-99%の精度(R-2乗係数)を平均絶対誤差1-5%で達成し、ニューラルネットワークが複雑な負荷分布関係を効果的に学習できることを実証した。
- 参考スコア(独自算出の注目度): 6.459138923461498
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce the first machine learning framework for predicting optimal processing times in Single-Level Tree Network (SLTN) architectures for the Divisible Load Theory (DLT) paradigm. Using a feedforward neural network(FNN) with 16 engineered features, we train a model on 100,000 synthetically generated configurations to predict optimal processing times without explicit formulation of DLT equations. The model achieves 97-99% accuracy (R-square factor) with mean absolute percentage error of 1-5%, demonstrating that neural networks can effectively learn complex load distribution relationships. Feature importance analysis reveals that the model implicitly captures DLT mathematical structure, including load conservation and simultaneous finishing constraints. With inference times under 1 millisecond, the approach provides 10-100x speedup over traditional DLT computation, enabling applications in real-time scheduling, design space exploration, and cloud resource allocation. The method generalizes well across diverse system configurations (n=3 to 20, load size =1 to 100 GB) with consistent accuracy, though performance degrades slightly for very large or highly heterogeneous systems. This work demonstrates the feasibility of using machine learning to accelerate distributed computing optimization while maintaining near-optimal accuracy.
- Abstract(参考訳): 本稿では、DLT(Divisible Load Theory)パラダイムのためのSLTNアーキテクチャにおいて、最適な処理時間を予測するための最初の機械学習フレームワークを提案する。
16種類の特徴を持つフィードフォワードニューラルネットワーク(FNN)を用いて、10万の合成合成構成のモデルを訓練し、DLT方程式の明示的な定式化なしに最適な処理時間を予測する。
このモデルでは、97-99%の精度(R-2乗係数)を平均絶対誤差1-5%で達成し、ニューラルネットワークが複雑な負荷分布関係を効果的に学習できることを実証した。
特徴重要度解析により,負荷の保存と同時終了制約を含むDLT数学的構造を暗黙的に捉えた。
1ミリ秒未満の推論時間で、このアプローチは従来のDLT計算よりも10-100倍のスピードアップを提供し、リアルタイムスケジューリング、設計空間探索、クラウドリソース割り当ての応用を可能にする。
この手法は様々なシステム構成(n=3から20)を一貫した精度で一般化するが、非常に大きなシステムや非常に異質なシステムでは性能がわずかに低下する。
この研究は、機械学習を用いて、ほぼ最適精度を維持しながら、分散コンピューティング最適化を高速化する可能性を示している。
関連論文リスト
- Deep Hierarchical Learning with Nested Subspace Networks [53.71337604556311]
大規模ニューラルネットワークのためのNested Subspace Networks (NSN)を提案する。
NSNは、単一のモデルを連続した計算予算の範囲で動的かつきめ細かな調整を可能にする。
我々は,NSNを訓練済みのLLMに外科的に適用し,スムーズで予測可能な計算性能フロンティアを解き放つことができることを示した。
論文 参考訳(メタデータ) (2025-09-22T15:13:14Z) - Symbolic Regression on FPGAs for Fast Machine Learning Inference [2.0920303420933273]
高エネルギー物理コミュニティは、FPGA(Field-Programmable Gate Arrays)上に機械学習ベースのソリューションをデプロイする可能性を探っている
シンボリックレグレッション(SR)と呼ばれる機械学習技術を利用した新しいエンドツーエンドプロシージャを提案する。
提案手法は,最大で5 nsまでの実行時間を最大13倍に抑えながら,90%以上の近似精度を維持した推論モデルを用いて3層ニューラルネットワークを近似できることを示す。
論文 参考訳(メタデータ) (2023-05-06T17:04:02Z) - Unifying Synergies between Self-supervised Learning and Dynamic
Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。
SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。
密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文 参考訳(メタデータ) (2023-01-22T17:12:58Z) - FINETUNA: Fine-tuning Accelerated Molecular Simulations [5.543169726358164]
本稿では,原子系のシミュレーションを効率的かつ正確に高速化するためのオンライン能動的学習フレームワークを提案する。
事前学習されたモデルから事前情報を組み込む伝達学習法は、DFT計算の数を91%減らしてシミュレーションを加速する。
30個のベンチマーク吸着剤触媒系の実験により,事前学習したモデルから事前情報を組み込むトランスファー学習法がシミュレーションを加速し,DFT計算の数を91%削減した。
論文 参考訳(メタデータ) (2022-05-02T21:36:01Z) - LCS: Learning Compressible Subspaces for Adaptive Network Compression at
Inference Time [57.52251547365967]
本稿では,ニューラルネットワークの「圧縮可能な部分空間」を訓練する手法を提案する。
構造的・非構造的空間に対する推定時間における微粒な精度・効率のトレードオフを任意に達成するための結果を示す。
我々のアルゴリズムは、可変ビット幅での量子化にまで拡張し、個別に訓練されたネットワークと同等の精度を実現する。
論文 参考訳(メタデータ) (2021-10-08T17:03:34Z) - Learning N:M Fine-grained Structured Sparse Neural Networks From Scratch [75.69506249886622]
ディープニューラルネットワーク(DNN)におけるスパーシティは、資源制約された環境でモデルを圧縮し、加速するために広く研究されている。
本稿では,N:M細粒構造スパースネットワークのスクラッチからトレーニングを初めて行う。
論文 参考訳(メタデータ) (2021-02-08T05:55:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。