論文の概要: Measurement of Generative AI Workload Power Profiles for Whole-Facility Data Center Infrastructure Planning
- arxiv url: http://arxiv.org/abs/2604.07345v1
- Date: Wed, 08 Apr 2026 17:56:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.671006
- Title: Measurement of Generative AI Workload Power Profiles for Whole-Facility Data Center Infrastructure Planning
- Title(参考訳): 全能データセンターインフラ計画のためのAIワークロードパワープロファイルの生成
- Authors: Roberto Vercellino, Jared Willard, Gustavo Campos, Weslley da Silva Pereira, Olivia Hull, Matthew Selensky, Juliane Mueller,
- Abstract要約: 本稿では,高分解能負荷電力測定と全能エネルギー需要を結びつけることでギャップを埋める手法を提案する。
我々は、AIトレーニング、微調整、推論ジョブのための0.1秒の解像度でAIワークロードの消費電力を測定する。
結果として生じる全ファシリティエネルギープロファイルは、AIワークロードとユーザビヘイビアによって駆動される現実的な時間的変動をキャプチャする。
- 参考スコア(独自算出の注目度): 1.2396819107017578
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid growth of generative artificial intelligence (AI) has introduced unprecedented computational demands, driving significant increases in the energy footprint of data centers. However, existing power consumption data is largely proprietary and reported at varying resolutions, creating challenges for estimating whole-facility energy use and planning infrastructure. In this work, we present a methodology that bridges this gap by linking high-resolution workload power measurements to whole-facility energy demand. Using NLR's high-performance computing data center equipped with NVIDIA H100 GPUs, we measure power consumption of AI workloads at 0.1-second resolution for AI training, fine-tuning and inference jobs. Workloads are characterized using MLCommons benchmarks for model training and fine-tuning, and vLLM benchmarks for inference, enabling reproducible and standardized workload profiling. The dataset of power consumption profiles is made publicly available. These power profiles are then scaled to the whole-facility-level using a bottom-up, event-driven, data center energy model. The resulting whole-facility energy profiles capture realistic temporal fluctuations driven by AI workloads and user-behavior, and can be used to inform infrastructure planning for grid connection, on-site energy generation, and distributed microgrids.
- Abstract(参考訳): 生成人工知能(AI)の急速な成長は、前例のない計算要求をもたらし、データセンターのエネルギーフットプリントを大幅に増加させた。
しかし、既存の電力消費データは、主にプロプライエタリであり、様々な解像度で報告されており、全体のエネルギー消費と計画インフラを推定するための課題を生み出している。
本研究では,高分解能負荷電力測定を全能エネルギー需要に結びつけることで,このギャップを埋める手法を提案する。
NVIDIA H100 GPUを搭載したNLRの高性能コンピューティングデータセンタを使用して、AIトレーニング、微調整、推論ジョブのための0.1秒の解像度でAIワークロードの消費電力を測定する。
ワークロードはモデルトレーニングと微調整のためのMLCommonsベンチマークと推論のためのvLLMベンチマークを使用して特徴付けられ、再現性と標準化されたワークロードプロファイリングを可能にする。
消費電力プロファイルのデータセットが公開されている。
これらのパワープロファイルはボトムアップ、イベント駆動、データセンターのエネルギーモデルを使用して、全体のファシリティレベルにスケールされる。
結果として生じる全ファシリティエネルギープロファイルは、AIワークロードとユーザビヘイビアによって駆動される現実的な時間的変動をキャプチャし、グリッド接続、オンサイトエネルギー生成、分散マイクログリッドのためのインフラストラクチャ計画の通知に使用することができる。
関連論文リスト
- From Prompts to Power: Measuring the Energy Footprint of LLM Inference [1.9116784879310027]
我々は、21のGPU構成と155のモデルアーキテクチャにわたる32,500以上の測定結果からなる大規模な測定ベース研究を提案する。
本稿では,vLLM推論エンジンを用いてエネルギー使用量を定量化し,構造的・運用的要因がいかにエネルギー需要を形作るかを明らかにする。
我々は、未確認のアーキテクチャやハードウェア間での推論エネルギー消費を正確に推定する予測モデルを開発し、それをブラウザ拡張として実装し、生成AIの環境影響に対する認識を高める。
論文 参考訳(メタデータ) (2025-11-05T15:06:46Z) - Improving AI Efficiency in Data Centres by Power Dynamic Response [74.12165648170894]
近年、人工知能(AI)の着実に成長が加速し、洗練されたモデルの開発が進められている。
AIの潜在能力を最大限に活用するためには、堅牢で信頼性の高い電力インフラの確保が不可欠だ。
しかし、AIデータセンターは電力に非常に飢えており、彼らの電力管理の問題が注目されている。
論文 参考訳(メタデータ) (2025-10-13T08:08:21Z) - Energy-Efficient Federated Learning for Edge Real-Time Vision via Joint Data, Computation, and Communication Design [43.89869891417806]
無線エッジデバイスにおけるリアルタイムコンピュータビジョン(CV)アプリケーションは、エネルギー効率とプライバシ保護の学習を必要とする。
信頼できない無線ネットワーク上でのリアルタイムCVのための超エネルギー効率FLフレームワークであるFedDPQを提案する。
論文 参考訳(メタデータ) (2025-08-03T13:05:11Z) - THOR: A Generic Energy Estimation Approach for On-Device Training [34.57867978862375]
THORは、ディープニューラルネットワーク(DNN)トレーニングにおけるエネルギー消費推定のための一般的なアプローチである。
我々は、様々な現実世界のプラットフォームにまたがる様々なタイプのモデルで広範な実験を行う。
その結果,THORは平均絶対パーセンテージ誤差(MAPE)を最大30%削減した。
論文 参考訳(メタデータ) (2025-01-27T03:29:02Z) - Filling the Missing: Exploring Generative AI for Enhanced Federated
Learning over Heterogeneous Mobile Edge Devices [72.61177465035031]
ローカルデータのFIMI(FIlling the MIssing)部分を活用することにより,これらの課題に対処する,AIを活用した創発的なフェデレーション学習を提案する。
実験の結果,FIMIはデバイス側エネルギーの最大50%を節約し,目標とするグローバルテスト精度を達成できることがわかった。
論文 参考訳(メタデータ) (2023-10-21T12:07:04Z) - Bringing AI to the edge: A formal M&S specification to deploy effective
IoT architectures [0.0]
モノのインターネットは私たちの社会を変え、生活の質と資源管理を改善する新しいサービスを提供しています。
これらのアプリケーションは、限られたコンピューティングリソースとパワーを持つ、複数の分散デバイスのユビキタスネットワークに基づいている。
フォグコンピューティングのような新しいアーキテクチャが登場し、コンピューティング基盤をデータソースに近づけている。
論文 参考訳(メタデータ) (2023-05-11T21:29:58Z) - Precise Energy Consumption Measurements of Heterogeneous Artificial
Intelligence Workloads [0.534434568021034]
本稿では,異なるタイプの計算ノード上でのディープラーニングモデルの典型的な2つの応用のエネルギー消費の測定を行う。
我々のアプローチの1つの利点は、スーパーコンピュータの全ユーザーがエネルギー消費に関する情報を利用できることである。
論文 参考訳(メタデータ) (2022-12-03T21:40:55Z) - Power Modeling for Effective Datacenter Planning and Compute Management [53.41102502425513]
我々は,すべてのハードウェア構成とワークロードに適用可能な,正確でシンプルで解釈可能な統計パワーモデルの設計と検証の2つのクラスについて論じる。
提案された統計的モデリング手法は, 単純かつスケーラブルでありながら, 4つの特徴のみを用いて, 95% 以上の多様な配電ユニット (2000 以上) に対して, 5% 未満の絶対パーセンテージエラー (MAPE) で電力を予測できることを実証した。
論文 参考訳(メタデータ) (2021-03-22T21:22:51Z) - A Framework for Energy and Carbon Footprint Analysis of Distributed and
Federated Edge Learning [48.63610479916003]
本稿では,分散学習政策の環境フットプリントに影響を与える要因を概説し,分析する。
バニラとコンセンサスによって駆動される分散FLポリシーの両方をモデル化する。
その結果、flは低ビット/ジュール効率を特徴とするワイヤレスシステムにおいて、顕著なエンドツーエンドの省エネ(30%-40%)が可能となった。
論文 参考訳(メタデータ) (2021-03-18T16:04:42Z) - Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable
Edge Computing Systems [87.4519172058185]
エッジコンピューティング機能を有するセルフパワー無線ネットワークの効率的なエネルギー分配機構について検討した。
定式化問題を解くために,新しいマルチエージェントメタ強化学習(MAMRL)フレームワークを提案する。
実験の結果、提案されたMAMRLモデルは、再生不可能なエネルギー使用量を最大11%削減し、エネルギーコストを22.4%削減できることが示された。
論文 参考訳(メタデータ) (2020-02-20T04:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。