論文の概要: LC-Opt: Benchmarking Reinforcement Learning and Agentic AI for End-to-End Liquid Cooling Optimization in Data Centers
- arxiv url: http://arxiv.org/abs/2511.00116v1
- Date: Fri, 31 Oct 2025 03:04:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.618712
- Title: LC-Opt: Benchmarking Reinforcement Learning and Agentic AI for End-to-End Liquid Cooling Optimization in Data Centers
- Title(参考訳): LC-Opt: データセンターにおけるエンドツーエンド液体冷却最適化のためのベンチマーク強化学習とエージェントAI
- Authors: Avisek Naug, Antonio Guillen, Vineet Kumar, Scott Greenwood, Wesley Brewer, Sahand Ghorbanpour, Ashwin Ramesh Babu, Vineet Gundecha, Ricardo Luna Gutierrez, Soumyendu Sarkar,
- Abstract要約: 本稿では,機械学習による液体冷却制御戦略のベンチマーク環境であるLC-Optを提案する。
オークリッジ国立研究所 (Oak Ridge National Lab) のフロンティア・スーパーコンピュータ冷却システム (Frontier Supercomputer cooling system) の高忠実なデジタルツインのベースライン上に構築され、LC-Optはモデルニカをベースとしたエンド・ツー・エンドの詳細なモデルを提供している。
我々は,集中型・分散型マルチエージェントRLアプローチをベンチマークし,解釈可能な制御のための決定木と回帰木へのポリシー蒸留を実証し,自然言語の制御動作を説明するLCMに基づく手法を探索する。
- 参考スコア(独自算出の注目度): 18.187205962508646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Liquid cooling is critical for thermal management in high-density data centers with the rising AI workloads. However, machine learning-based controllers are essential to unlock greater energy efficiency and reliability, promoting sustainability. We present LC-Opt, a Sustainable Liquid Cooling (LC) benchmark environment, for reinforcement learning (RL) control strategies in energy-efficient liquid cooling of high-performance computing (HPC) systems. Built on the baseline of a high-fidelity digital twin of Oak Ridge National Lab's Frontier Supercomputer cooling system, LC-Opt provides detailed Modelica-based end-to-end models spanning site-level cooling towers to data center cabinets and server blade groups. RL agents optimize critical thermal controls like liquid supply temperature, flow rate, and granular valve actuation at the IT cabinet level, as well as cooling tower (CT) setpoints through a Gymnasium interface, with dynamic changes in workloads. This environment creates a multi-objective real-time optimization challenge balancing local thermal regulation and global energy efficiency, and also supports additional components like a heat recovery unit (HRU). We benchmark centralized and decentralized multi-agent RL approaches, demonstrate policy distillation into decision and regression trees for interpretable control, and explore LLM-based methods that explain control actions in natural language through an agentic mesh architecture designed to foster user trust and simplify system management. LC-Opt democratizes access to detailed, customizable liquid cooling models, enabling the ML community, operators, and vendors to develop sustainable data center liquid cooling control solutions.
- Abstract(参考訳): 液体冷却は、AIワークロードの増加に伴い、高密度のデータセンターでの熱管理に不可欠である。
しかし、機械学習ベースのコントローラは、より大きなエネルギー効率と信頼性を解放し、持続可能性を促進するために不可欠である。
本稿では,高効率コンピューティング(HPC)システムの高効率液体冷却における強化学習(RL)制御戦略のためのLC-Optベンチマーク環境を提案する。
LC-Optはオークリッジ国立研究所のフロンティアスーパーコンピュータ冷却システムの高忠実なデジタルツインのベースライン上に構築されており、データセンターのキャビネットやサーバーブレードグループに、サイトレベルの冷却塔にまたがるモデルニカをベースとしたエンド・ツー・エンドの詳細なモデルを提供している。
RLエージェントは、液体供給温度、流量、ITキャビネットレベルでのグラニュラーバルブアクチュエータなどの重要な熱制御を最適化し、Gymnasiumインターフェースによる冷却塔(CT)セットポイントを動的に変更する。
この環境は、局所的な熱規制と地球規模のエネルギー効率のバランスをとる多目的リアルタイム最適化の課題を生み出し、熱回収ユニット(HRU)のような追加のコンポーネントもサポートする。
我々は、集中型・分散型マルチエージェントRLアプローチをベンチマークし、解釈可能な制御のための決定木と回帰木へのポリシー蒸留を実証し、ユーザ信頼の促進とシステム管理の簡素化を目的としたエージェントメッシュアーキテクチャを用いて自然言語の制御動作を説明するLCMベースの手法を探索する。
LC-Optは、詳細でカスタマイズ可能な液体冷却モデルへのアクセスを民主化し、MLコミュニティ、オペレータ、ベンダーが持続可能なデータセンターの液体冷却制御ソリューションを開発することを可能にする。
関連論文リスト
- Hierarchical Multi-Agent Framework for Carbon-Efficient Liquid-Cooled Data Center Clusters [5.335496791443277]
本稿では,Reinforcement Learning (RL) に基づく階層型コントローラを提案するGreen-DCCについて紹介する。
本稿では,複数のデータセンターを同期的に最適化し,デジタル双生児を対象とし,炭素排出量とサステナビリティ指標に基づく様々なRL手法の性能比較を行う。
論文 参考訳(メタデータ) (2025-02-12T12:00:58Z) - Sustainability of Data Center Digital Twins with Reinforcement Learning [2.4971633082970377]
機械学習(ML)は、計算能力の需要が増大し、データセンター(DC)が大きくなり、エネルギー消費が増加した。
この問題に対処し、二酸化炭素排出量を減らすために、ITサーバ、キャビネット、HVAC冷却、柔軟な負荷シフト、バッテリーエネルギー貯蔵といったDCコンポーネントの設計と制御が不可欠である。
DCRL-GreenはマルチエージェントのRL環境であり、MLコミュニティがデータセンターを設計し、DCの炭素フットプリント削減のためのRLコントローラを開発し、改良することを可能にする。
論文 参考訳(メタデータ) (2024-04-16T18:22:30Z) - An LLM-Based Digital Twin for Optimizing Human-in-the Loop Systems [13.388869442538399]
本稿では,ショッピングモールにおける多様な集団の行動と熱的嗜好を模倣するために,大規模言語モデル(LLM)を用いたケーススタディを提案する。
集約された熱嗜好は、エージェント・イン・ザ・ループに基づく強化学習アルゴリズムであるAitL-RLに統合される。
以上の結果から,LLMは大規模オープンスペース内での複雑な人口移動をシミュレートできることがわかった。
論文 参考訳(メタデータ) (2024-03-25T14:32:28Z) - Autonomous Payload Thermal Control [55.2480439325792]
小さな衛星では、熱制御装置、科学機器、電子部品のスペースは少ない。
深部強化学習を用いた自律型熱制御ツールを提案する。
提案するフレームワークは,運用範囲の温度を維持するためにペイロード処理能力の制御を学べる。
論文 参考訳(メタデータ) (2023-07-28T09:40:19Z) - Laxity-Aware Scalable Reinforcement Learning for HVAC Control [2.0625936401496237]
我々は,各操作要求の緊急レベルを定量化するために,遅延の概念を活用することにより,モデリングと制御における次元問題の呪いに取り組む。
本研究では,多くのHVACシステムに対する2段階のエネルギー最適化手法を提案する。
論文 参考訳(メタデータ) (2023-06-29T01:28:14Z) - Low Emission Building Control with Zero-Shot Reinforcement Learning [70.70479436076238]
強化学習(RL)による制御は、建築エネルギー効率を著しく向上させることが示されている。
我々は、ゼロショットビルディング制御と呼ばれるパラダイムを優先せずに、排出削減ポリシーを得られることを示す。
論文 参考訳(メタデータ) (2022-08-12T17:13:25Z) - Data-Driven Learning and Load Ensemble Control [1.647866856596524]
本研究の目的は、グリッドサポートサービスを提供するために、温度制御可能な負荷(TCL)など、分散された小規模のフレキシブルな負荷に取り組むことである。
このデータ駆動学習の効率性は, 住宅のテストベッド地区における暖房, 冷却, 換気ユニットのシミュレーションによって実証される。
論文 参考訳(メタデータ) (2020-04-20T23:32:10Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。