論文の概要: A Unified Python Framework for Direct PPO-based Control of AHUs with Economizer Logic and CO2-Constrained Ventilation
- arxiv url: http://arxiv.org/abs/2605.24406v1
- Date: Sat, 23 May 2026 05:31:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.038284
- Title: A Unified Python Framework for Direct PPO-based Control of AHUs with Economizer Logic and CO2-Constrained Ventilation
- Title(参考訳): Economizer Logic と CO2-Constrained Ventilation によるAHUの直接PPO制御のための統一Pythonフレームワーク
- Authors: Erfan Haghighat Damavandi, Davide Papurello, Mahdi Alibeigi, Armin Keshavarz, Simone Canevarolo, Marco Condo,
- Abstract要約: 本稿では,Deep Reinforcement Learning (DRL)アルゴリズムを用いたHVACシステムの最適化手法を提案する。
DRLシステムは、2次キャパシタの熱モデルとCO2の動的質量バランスを統合して、建物に関連する複雑な物理を再現する。
エンタルピーベースのエコノマイザは、屋外環境から自由に冷却するために使用される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Optimizing HVAC (Heating, Ventilation and Air Conditioning) can enhance a building's energy efficiency while providing comfort levels for its occupants. Using conventional control systems to maintain HVAC functions is often difficult because of the nonlinear characteristics of a building envelope as it experiences stochastic load variations over time. This paper presents a new approach to optimizing HVAC systems through the use of Deep Reinforcement Learning (DRL) algorithms and the Proximal Policy Optimization (PPO) algorithm implemented in a custom Python performance environment. The DRL system uses a second order resistor-capacitor thermal model and an integrated dynamic mass balance of CO2 to replicate the complex physics associated with buildings. One major innovation of this study is a "Hierarchical Flow Logic," which provides the means to ensure that indoor air quality (IAQ) is maintained by overriding the accepted actions of the agent that cause CO2 to exceed 1000 ppm. In addition, an enthalpy-based economiser is used to create free cooling from the outdoor environment. The experimental data shows that compared to PID controllers tuned by GA or traditional On-Off controls, a PPO agent has better temperature stability and energy efficiency overall. An end-to-end pipeline provides an avenue for robust and generalized solutions to help implement smart building energy management within the context of real hardware implementation.
- Abstract(参考訳): HVAC (Heating, Ventilation and Air Conditioning) の最適化は、居住者に快適なレベルを提供しながら、建物のエネルギー効率を高めることができる。
HVAC関数の維持に従来の制御系を用いることは、時間とともに確率的負荷変動を経験する建物エンベロープの非線形特性のため、しばしば困難である。
本稿では,HVAC システムを最適化するための新しいアプローチとして,Dreep Reinforcement Learning (DRL) アルゴリズムと PPO (Proximal Policy Optimization) アルゴリズムをカスタムPython のパフォーマンス環境に実装した手法を提案する。
DRLシステムは2次抵抗・キャパシタ熱モデルとCO2の動的質量バランスを統合して、建物に関連する複雑な物理を再現する。
この研究の大きな革新の1つは「階層的フロー論理」であり、これはCO2を1000ppmを超えさせるエージェントの受容された作用をオーバーライドすることで室内空気質(IAQ)を確実に維持する手段を提供する。
また、エンタルピーをベースとしたエコノマイザは、屋外環境から自由に冷却するために用いられる。
実験データによると、GAや従来のオンオフ制御で調整されたPIDコントローラと比較して、PPOエージェントは全体の温度安定性とエネルギー効率が良くなっている。
エンドツーエンドパイプラインは、実ハードウェア実装のコンテキスト内でスマートな構築エネルギー管理を実装するのに役立つ、堅牢で汎用的なソリューションの道を提供する。
関連論文リスト
- Shielded Controller Units for RL with Operational Constraints Applied to Remote Microgrids [50.64533198075622]
強化学習(Reinforcement Learning, RL)は、不確実性の下で複雑なシステムにおける意思決定を最適化するための強力なフレームワークである。
本稿では,システムダイナミクスの事前知識を活用する体系的かつ解釈可能なアプローチであるシールド制御ユニット(SCU)を紹介する。
本研究では,厳密な運用要件を持つ遠隔マイクログリッド最適化タスクにおけるSCUの有効性を示す。
論文 参考訳(メタデータ) (2025-11-30T19:28:34Z) - Mind Your Entropy: From Maximum Entropy to Trajectory Entropy-Constrained RL [56.085103402298905]
本稿では,この2つの課題に対処する軌道エントロピー制約強化学習(TECRL)フレームワークを提案する。
このフレームワーク内では、まず報酬とエントロピーに関連する2つのQ-関数を個別に学習し、温度更新の影響を受けないクリーンで安定した値ターゲットを確保する。
我々は,3つの改良を加えて,最先端の分散型ソフトアクター批判を拡張して,現実的な非政治的アルゴリズムDSAC-Eを開発した。
論文 参考訳(メタデータ) (2025-10-25T09:17:47Z) - Optimizing Indoor Environmental Quality in Smart Buildings Using Deep Learning [0.0]
本稿では,IEQパラメータ,特にCO2濃度,温度,湿度を積極的に管理する深層学習型手法を提案する。
我々は,Long Short-Term Memory (LSTM), Gated Recurrent Units (GRU), and a hybrid Convolutional Neural Network LSTM (CNN-LSTM) の3つのアーキテクチャをベンチマークした。
以上の結果から,GRUは計算オーバーヘッドを低く抑えるとともに,CNN-LSTMは拡張予測ウィンドウの主機能抽出に優れることがわかった。
論文 参考訳(メタデータ) (2025-09-30T12:42:34Z) - Diffusion-Modeled Reinforcement Learning for Carbon and Risk-Aware Microgrid Optimization [48.70916202664808]
DiffCarl(ディフカール)は、マルチマイクログリッドシステムのインテリジェントな操作のための、拡散モデルによる炭素およびリスクを考慮した強化学習アルゴリズムである。
従来のアルゴリズムと最先端のDRLソリューションを2.3-30.1%削減した。
また、炭素を意識しない変種よりも28.7%低い炭素排出量を達成し、性能の変動を減少させる。
論文 参考訳(メタデータ) (2025-07-22T03:27:07Z) - Data-driven operator learning for energy-efficient building control [2.3326951882644553]
本稿では,CFDの物理精度と機械学習の計算効率を組み合わせ,エネルギー効率の高い建築換気制御を実現するためのデータ駆動型フレームワークを提案する。
我々は,高分解能CFDデータを用いて,制御動作から気流分布へのマッピングを学習するために,ニューラル演算子変換器を訓練する。
提案手法は, 地域平均CO2予測に基づく最大流量制御, ルールベース制御, およびデータ駆動制御と比較して, 大幅な省エネを実現していることを示す。
論文 参考訳(メタデータ) (2025-04-30T00:45:49Z) - Global Transformer Architecture for Indoor Room Temperature Forecasting [49.32130498861987]
本研究は,多室ビルにおける室内温度予測のためのグローバルトランスフォーマーアーキテクチャを提案する。
エネルギー消費を最適化し、HVACシステムに関連する温室効果ガス排出を削減することを目的としている。
本研究は,マルチルームビルにおける室内温度予測にトランスフォーマーアーキテクチャを適用した最初の事例である。
論文 参考訳(メタデータ) (2023-10-31T14:09:32Z) - Surrogate Empowered Sim2Real Transfer of Deep Reinforcement Learning for
ORC Superheat Control [12.567922037611261]
本稿では,ORCスーパーヒート制御のためのSim2Real転送学習型DRL制御法を提案する。
実験結果から,ORC制御問題におけるDRLのトレーニング速度を大幅に向上することがわかった。
論文 参考訳(メタデータ) (2023-08-05T01:59:44Z) - Data-driven HVAC Control Using Symbolic Regression: Design and
Implementation [0.0]
本研究では,データ駆動加熱・換気・空調制御の設計と実装手法を提案する。
熱力学の構築は、収集されたデータから構築されたシンボリック回帰モデル(SRM)を用いてモデル化される。
提案フレームワークは、広く使われているサーモスタットコントローラと比較してピーク電力を16.1%削減する。
論文 参考訳(メタデータ) (2023-04-06T13:57:50Z) - Low Emission Building Control with Zero-Shot Reinforcement Learning [70.70479436076238]
強化学習(RL)による制御は、建築エネルギー効率を著しく向上させることが示されている。
我々は、ゼロショットビルディング制御と呼ばれるパラダイムを優先せずに、排出削減ポリシーを得られることを示す。
論文 参考訳(メタデータ) (2022-08-12T17:13:25Z) - Development of a Soft Actor Critic Deep Reinforcement Learning Approach
for Harnessing Energy Flexibility in a Large Office Building [0.0]
本研究は,Soft Actor Critic'(SAC)に基づくDeep Reinforcement Learning(DRL)の新規適用と研究に関するものである。
SACは、連続的なアクションスペースを処理できるモデルフリーのDRL技術です。
論文 参考訳(メタデータ) (2021-04-25T10:33:35Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。