論文の概要: DCcluster-Opt: Benchmarking Dynamic Multi-Objective Optimization for Geo-Distributed Data Center Workloads
- arxiv url: http://arxiv.org/abs/2511.00117v1
- Date: Fri, 31 Oct 2025 03:07:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.619976
- Title: DCcluster-Opt: Benchmarking Dynamic Multi-Objective Optimization for Geo-Distributed Data Center Workloads
- Title(参考訳): DCcluster-Opt: 地理的分散データセンターワークロードに対する動的多目的最適化のベンチマーク
- Authors: Antonio Guillen-Perez, Avisek Naug, Vineet Gundecha, Sahand Ghorbanpour, Ricardo Luna Gutierrez, Ashwin Ramesh Babu, Munther Salim, Shubhanker Banerjee, Eoin H. Oude Essink, Damien Fay, Soumyendu Sarkar,
- Abstract要約: 持続可能な時空間タスクスケジューリングのためのオープンソースの高忠実度シミュレーションベンチマークであるDCcluster-Optを提案する。
AIのワークロードトレース、グリッドカーボンの強度、電力市場、20のグローバルリージョンにわたる天候、クラウド送信コスト、経験的ネットワーク遅延パラメータなど、実世界のデータセットを組み合わせている。
モジュール型報酬システムは、二酸化炭素排出量、エネルギーコスト、サービスレベル合意、水利用の間のトレードオフを明示的に研究することを可能にする。
- 参考スコア(独自算出の注目度): 14.834687262955585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The increasing energy demands and carbon footprint of large-scale AI require intelligent workload management in globally distributed data centers. Yet progress is limited by the absence of benchmarks that realistically capture the interplay of time-varying environmental factors (grid carbon intensity, electricity prices, weather), detailed data center physics (CPUs, GPUs, memory, HVAC energy), and geo-distributed network dynamics (latency and transmission costs). To bridge this gap, we present DCcluster-Opt: an open-source, high-fidelity simulation benchmark for sustainable, geo-temporal task scheduling. DCcluster-Opt combines curated real-world datasets, including AI workload traces, grid carbon intensity, electricity markets, weather across 20 global regions, cloud transmission costs, and empirical network delay parameters with physics-informed models of data center operations, enabling rigorous and reproducible research in sustainable computing. It presents a challenging scheduling problem where a top-level coordinating agent must dynamically reassign or defer tasks that arrive with resource and service-level agreement requirements across a configurable cluster of data centers to optimize multiple objectives. The environment also models advanced components such as heat recovery. A modular reward system enables an explicit study of trade-offs among carbon emissions, energy costs, service level agreements, and water use. It provides a Gymnasium API with baseline controllers, including reinforcement learning and rule-based strategies, to support reproducible ML research and a fair comparison of diverse algorithms. By offering a realistic, configurable, and accessible testbed, DCcluster-Opt accelerates the development and validation of next-generation sustainable computing solutions for geo-distributed data centers.
- Abstract(参考訳): 大規模AIのエネルギー需要の増加と炭素フットプリントは、グローバルな分散データセンターにおけるインテリジェントなワークロード管理を必要としている。
しかし、時間的に変化する環境要因(炭素強度、電気価格、天気)、詳細なデータセンター物理(CPU、GPU、メモリ、HVACエネルギー)、地理的に分散されたネットワーク力学(レイテンシと送信コスト)の相互作用を現実的に捉えるベンチマークが存在しないため、進歩は限られている。
このギャップを埋めるため、持続可能な時空間タスクスケジューリングのためのオープンソースの高忠実度シミュレーションベンチマークであるDCcluster-Optを提示する。
DCcluster-Optは、AIワークロードトレース、グリッドカーボン強度、電気市場、20のグローバルリージョンにわたる天気、クラウド送信コスト、および実証的なネットワーク遅延パラメータを含む、実世界のデータセットを、物理でインフォームドされたデータセンター操作モデルと組み合わせ、持続可能なコンピューティングにおける厳密で再現可能な研究を可能にする。
トップレベルのコーディネートエージェントが、複数の目的を最適化するために、構成可能なデータセンタクラスタをまたいでリソースやサービスレベルの合意要件に到達したタスクを動的に再割り当てまたは延期しなければならないという、困難なスケジューリング問題を提示します。
環境はまた、熱回復のような先進的なコンポーネントもモデル化している。
モジュール型報酬システムは、二酸化炭素排出量、エネルギーコスト、サービスレベル合意、水利用の間のトレードオフを明示的に研究することを可能にする。
Gymnasium APIには、強化学習とルールベースの戦略を含むベースラインコントローラがあり、再現可能なML研究と多様なアルゴリズムの公正な比較をサポートする。
DCcluster-Optは、現実的で、構成可能で、アクセス可能なテストベッドを提供することで、地理的に分散したデータセンターのための、次世代の持続可能なコンピューティングソリューションの開発と検証を加速します。
関連論文リスト
- Power Grid Control with Graph-Based Distributed Reinforcement Learning [60.49805771047161]
この作業は、リアルタイムでスケーラブルなグリッド管理のためのグラフベースの分散強化学習フレームワークを前進させる。
グラフニューラルネットワーク(GNN)を使用して、ネットワークのトポロジ情報を単一の低レベルエージェントの観測内にエンコードする。
Grid2Opシミュレーション環境での実験は、このアプローチの有効性を示している。
論文 参考訳(メタデータ) (2025-09-02T22:17:25Z) - Benchmarking LLMs' Swarm intelligence [51.648605206159125]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [58.50944604905037]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文 参考訳(メタデータ) (2025-05-03T13:55:38Z) - Hierarchical Multi-Agent Framework for Carbon-Efficient Liquid-Cooled Data Center Clusters [5.335496791443277]
本稿では,Reinforcement Learning (RL) に基づく階層型コントローラを提案するGreen-DCCについて紹介する。
本稿では,複数のデータセンターを同期的に最適化し,デジタル双生児を対象とし,炭素排出量とサステナビリティ指標に基づく様々なRL手法の性能比較を行う。
論文 参考訳(メタデータ) (2025-02-12T12:00:58Z) - SustainDC: Benchmarking for Sustainable Data Center Control [4.159959816797259]
データセンター(DC)のためのマルチエージェント強化学習(MARL)アルゴリズムをベンチマークするためのPython環境セットであるSustainDCを紹介する。
SustainDCは、ワークロードスケジューリング、冷却最適化、補助バッテリー管理などのカスタムDC構成とタスクをサポートする。
SustainDC上での各種MARLアルゴリズムの評価を行い, 各種DC設計, 位置, 気象条件, グリッドカーボン強度, 負荷負荷条件などを検討した。
論文 参考訳(メタデータ) (2024-08-14T22:43:52Z) - MOSAIC: A Multi-Objective Optimization Framework for Sustainable
Datacenter Management [2.9699290794642366]
持続可能なデータセンター管理のための新しいフレームワークを提案する。
我々は、再生可能エネルギー源、可変エネルギーコスト、電力利用効率、炭素要因、エネルギー中の水強度など、地理的および時間的要因を考慮に入れている。
我々のフレームワークは、最先端技術と比較して最大4.61倍の目的(炭素、水、コスト)で累積的な改善を実現している。
論文 参考訳(メタデータ) (2023-11-14T23:05:37Z) - Sustainable AIGC Workload Scheduling of Geo-Distributed Data Centers: A
Multi-Agent Reinforcement Learning Approach [48.18355658448509]
生成的人工知能の最近の進歩は、機械学習トレーニングの需要が急増し、エネルギー消費の大幅な増加によるコスト負担と環境問題を引き起こしている。
地理的に分散したクラウドデータセンタ間でのトレーニングジョブのスケジューリングは、安価で低炭素エネルギーのコンピューティング能力の使用を最適化する機会を浮き彫りにする。
本研究では,実生活におけるワークロードパターン,エネルギー価格,炭素強度を組み込んだクラウドシステムと対話することで,マルチエージェント強化学習とアクタクリティカルな手法に基づく最適協調スケジューリング戦略の学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-17T02:12:30Z) - Measuring the Carbon Intensity of AI in Cloud Instances [91.28501520271972]
我々は,ソフトウェアの炭素強度を測定するための枠組みを提供し,運転中の炭素排出量を測定することを提案する。
私たちは、Microsoft Azureクラウドコンピューティングプラットフォームにおける排出削減のための一連のアプローチを評価します。
論文 参考訳(メタデータ) (2022-06-10T17:04:04Z) - HUNTER: AI based Holistic Resource Management for Sustainable Cloud
Computing [26.48962351761643]
我々は,HUNTERと呼ばれる持続可能なクラウドコンピューティングのための人工知能(AI)に基づく総合的資源管理手法を提案する。
提案モデルでは,多目的スケジューリング問題として,データセンターのエネルギー効率を最適化する目標を定式化している。
シミュレーションおよび物理雲環境の実験により、HUNTERはエネルギー消費、SLA違反、スケジューリング時間、コスト、温度を最大12、35、43、54、3%で上回った。
論文 参考訳(メタデータ) (2021-10-11T18:11:26Z) - A Framework for Energy and Carbon Footprint Analysis of Distributed and
Federated Edge Learning [48.63610479916003]
本稿では,分散学習政策の環境フットプリントに影響を与える要因を概説し,分析する。
バニラとコンセンサスによって駆動される分散FLポリシーの両方をモデル化する。
その結果、flは低ビット/ジュール効率を特徴とするワイヤレスシステムにおいて、顕著なエンドツーエンドの省エネ(30%-40%)が可能となった。
論文 参考訳(メタデータ) (2021-03-18T16:04:42Z) - Artificial Intelligence (AI)-Centric Management of Resources in Modern
Distributed Computing Systems [22.550075095184514]
Cloud Data Centres (DCS) は大規模で複雑で異種であり、複数のネットワークと地理的境界に分散している。
IoT(Internet of Things)駆動のアプリケーションは、リアルタイム処理と迅速な応答を必要とする膨大なデータを生成しています。
既存のリソース管理システム(RMS)は、そのような複合システムや動的システムには静的またはソリューションが不十分である。
論文 参考訳(メタデータ) (2020-06-09T06:54:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。