論文の概要: A Physics-Aware Framework for Short-Term GPU Power Forecasting of AI Data Centers
- arxiv url: http://arxiv.org/abs/2605.04074v1
- Date: Tue, 14 Apr 2026 04:14:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 06:56:26.571493
- Title: A Physics-Aware Framework for Short-Term GPU Power Forecasting of AI Data Centers
- Title(参考訳): AIデータセンターの短期GPU電力予測のための物理認識フレームワーク
- Authors: Mohammad AlShaikh Saleh, Sanjay Chawla, Sertac Bayhan, Haitham Abu-Rub, Ali Ghrayeb,
- Abstract要約: 本稿では,今後5~80分でAIデータセンターの電力利用を正確に予測できる物理インフォームド時系列モデルを提案する。
このモデルは、実際のAIデータセンタデータセットでトレーニングされ、評価され、テストされた最先端(SOTA)モデルよりも正確である。
SOTAトランスおよび非トランスフォーマーベースのモデルと比較して、予測精度の改善はMSEの0.782%-39.08%、MAEの0.993%-51.82%、RMSEの0.370%-22.28%である。
- 参考スコア(独自算出の注目度): 7.256390775982009
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI data centers experience rapid fluctuations in power demand due to the heterogeneity of computational tasks that they have to support. For example, the power profile of inference and training of large language models (LLMs) is quite distinct and big divergences can result in the instability of the underlying electricity grid. In this paper we propose, to the best of our knowledge, the first physics-informed DLinear time-series model that can accurately forecast power utilization of an AI data center 5-80 minutes (short-term forecasting) into the future. The physics, based on a multi-node lumped thermal resistance-capacitance (RC) network consistent with Newton's law of cooling, is captured using newly derived time-dependent ordinary differential equations (ODE) that separately models and interlinks power consumption with the GPU compute and memory utilization and temperature. The resulting model, that we refer to as PI-DLinear, trained and evaluated on a real AI data center dataset and is not only more accurate than the state-of-the-art (SOTA) models tested, but the forecast profile respects the underlying physics under power throttling and load transient events. Relative to the SOTA transformer-based and non-transformer-based models, improvements in forecasting accuracy (averaged across all look-back and prediction windows) range from 0.782%-39.08% for MSE, 0.993%-51.82% for MAE, and 0.370%-22.28% for RMSE.
- Abstract(参考訳): AIデータセンターは、彼らがサポートしなければならない計算タスクの不均一性のために、電力需要の急激な変動を経験する。
例えば、大規模言語モデル(LLM)の推論と訓練のパワープロファイルは、かなり異なっており、大きなばらつきは、基礎となる電力網の不安定性をもたらす可能性がある。
本稿では,我々の知る限り,AIデータセンターの電力利用を5~80分(短期予測)で正確に予測できる最初の物理インフォームドDLinear時系列モデルを提案する。
この物理は、ニュートンの冷却法則と整合したマルチノードラッピング熱抵抗容量(RC)ネットワークに基づいており、GPU計算とメモリ利用と温度を別々にモデル化し、電力消費を相互接続する、新たに導出した時間依存常微分方程式(ODE)を用いて捉えている。
PI-DLinearと呼ばれる結果のモデルは、実際のAIデータセンタデータセットでトレーニングされ、評価され、テストされた最先端(SOTA)モデルよりも正確であるだけでなく、予測プロファイルは、パワースロットリングと負荷過渡的なイベントの下で基礎となる物理を尊重する。
SOTAトランスおよび非トランスフォーマーベースのモデルと比較して、予測精度の改善(すべてのルックバックと予測ウィンドウの平均)は、MSEが0.782%-39.08%、MAEが0.993%-51.82%、RMSEが0.370%-22.28%である。
関連論文リスト
- IISE PG&E Energy Analytics Challenge 2025: Hourly-Binned Regression Models Beat Transformers in Load Forecasting [0.0]
本研究では,古典的回帰手法から高度なディープラーニングアーキテクチャに至るまで,予測モデルを評価する。
このデータセットには、過去2年間の電力負荷データと、5つの場所にわたる温度およびグローバル水平照射(GHI)が含まれている。
その結果、TimeGPTを含むディープラーニングモデルは、より単純な統計的および機械学習アプローチを一貫して上回りません。
論文 参考訳(メタデータ) (2025-05-16T15:55:34Z) - Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.24539704456791]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文 参考訳(メタデータ) (2024-07-18T15:44:23Z) - Generalizing Weather Forecast to Fine-grained Temporal Scales via Physics-AI Hybrid Modeling [55.13352174687475]
本稿では,天気予報をトレーニングデータセットを超える微細な時間スケールに一般化する物理AIハイブリッドモデル(WeatherGFT)を提案する。
具体的には、小さな時間スケールで物理進化をシミュレートするために、慎重に設計されたPDEカーネルを用いる。
また、異なるリードタイムでのモデルの一般化を促進するためのリードタイムアウェアトレーニングフレームワークも導入する。
論文 参考訳(メタデータ) (2024-05-22T16:21:02Z) - Secure short-term load forecasting for smart grids with
transformer-based federated learning [0.0]
電力負荷予測は、需要と供給収支を補助するスマートグリッドの中で不可欠なタスクである。
きめ細かい負荷プロファイルは、ユーザの消費電力の挙動を公開できるため、プライバシやセキュリティ上の懸念が高まる。
本稿では,短期電力負荷予測のためのフェデレーション学習を用いた変圧器を用いた新しい深層学習手法を提案する。
論文 参考訳(メタデータ) (2023-10-26T15:27:55Z) - Deep Physics Corrector: A physics enhanced deep learning architecture
for solving stochastic differential equations [0.0]
微分方程式(SDE)によって制御される物理系に対する新しいグレーボックスモデリングアルゴリズムを提案する。
提案手法はDeep Physics Corrector(DPC)と呼ばれ、SDEとDeep Neural Network(DNN)で表される近似物理学をブレンドする。
本論文では,本論文の4つのベンチマーク例について,提案したDPCの性能について述べる。
論文 参考訳(メタデータ) (2022-09-20T14:30:07Z) - Physics-informed linear regression is a competitive approach compared to
Machine Learning methods in building MPC [0.8135412538980287]
総じて, ビルのベースラインコントローラと比較して, 暖房・冷却エネルギーの低減効果が良好であることが示唆された。
また, 物理インフォームドARMAXモデルは, 計算負担が低く, 機械学習モデルと比較して, サンプル効率が優れていることも確認した。
論文 参考訳(メタデータ) (2021-10-29T16:56:05Z) - Thermal Neural Networks: Lumped-Parameter Thermal Modeling With
State-Space Machine Learning [0.0]
電力システムの熱モデルには、リアルタイム能力と高い推定精度の両方が必要である。
本研究では,熱伝達に基づくラムド型パラメータモデルとして,熱ニューラルネットワーク(TNN)を導入し,両者を統一した。
TNNは状態空間表現を通じて物理的に解釈可能な状態を持ち、エンドツーエンドのトレーニング可能であり、その設計に材料、幾何学、専門知識を必要としない。
論文 参考訳(メタデータ) (2021-03-30T13:15:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。