論文の概要: Safe Deep Reinforcement Learning for Building Heating Control and Demand-side Flexibility
- arxiv url: http://arxiv.org/abs/2604.16033v1
- Date: Fri, 17 Apr 2026 13:03:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.924059
- Title: Safe Deep Reinforcement Learning for Building Heating Control and Demand-side Flexibility
- Title(参考訳): ビルの暖房制御と需要側フレキシビリティのための安全な深層強化学習
- Authors: Colin Jüni, Mina Montazeri, Yi Guo, Federica Bellizio, Giovanni Sansavini, Philipp Heer,
- Abstract要約: ビルは世界のエネルギー消費の約40%を占めている。
本稿では,建築空間の暖房を最適化するための深部強化学習に基づく安全な制御フレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.9714388855765344
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Buildings account for approximately 40% of global energy consumption, and with the growing share of intermittent renewable energy sources, enabling demand-side flexibility, particularly in heating, ventilation and air conditioning systems, is essential for grid stability and energy efficiency. This paper presents a safe deep reinforcement learning-based control framework to optimize building space heating while enabling demand-side flexibility provision for power system operators. A deep deterministic policy gradient algorithm is used as the core deep reinforcement learning method, enabling the controller to learn an optimal heating strategy through interaction with the building thermal model while maintaining occupant comfort, minimizing energy cost, and providing flexibility. To address safety concerns with reinforcement learning, particularly regarding compliance with flexibility requests, we propose a real-time adaptive safety-filter to ensure that the system operates within predefined constraints during demand-side flexibility provision. The proposed real-time adaptive safety filter guarantees full compliance with flexibility requests from system operators and improves energy and cost efficiency -- achieving up to 50% savings compared to a rule-based controller -- while outperforming a standalone deep reinforcement learning-based controller in energy and cost metrics, with only a slight increase in comfort temperature violations.
- Abstract(参考訳): ビルは世界のエネルギー消費の約40%を占めており、断続的な再生可能エネルギー源のシェアが増大しているため、特に暖房、換気、空調システムにおいて需要側の柔軟性はグリッド安定性とエネルギー効率に不可欠である。
本稿では、電力系統運用者に対する需要側フレキシビリティの提供を実現しつつ、建築空間の暖房を最適化する安全な深層強化学習に基づく制御フレームワークを提案する。
奥行き決定性ポリシ勾配アルゴリズムをコア深度強化学習法として使用し、利用者の快適性を維持し、エネルギーコストを最小化し、柔軟性を確保しつつ、建築熱モデルとの相互作用を通じて最適な加熱戦略を学習できるようにする。
本稿では,特にフレキシビリティ要求の遵守に関する強化学習による安全性の懸念に対処するため,要求側フレキシビリティ提供時において,システムが予め定義された制約内で動作することを保証するためのリアルタイム適応型安全フィルタを提案する。
提案されたリアルタイム適応型安全フィルタは、システムオペレータからの柔軟性要求への完全準拠を保証し、エネルギーとコスト効率の改善 -- ルールベースのコントローラと比較して最大50%の省エネを実現します。
関連論文リスト
- Shielded Controller Units for RL with Operational Constraints Applied to Remote Microgrids [50.64533198075622]
強化学習(Reinforcement Learning, RL)は、不確実性の下で複雑なシステムにおける意思決定を最適化するための強力なフレームワークである。
本稿では,システムダイナミクスの事前知識を活用する体系的かつ解釈可能なアプローチであるシールド制御ユニット(SCU)を紹介する。
本研究では,厳密な運用要件を持つ遠隔マイクログリッド最適化タスクにおけるSCUの有効性を示す。
論文 参考訳(メタデータ) (2025-11-30T19:28:34Z) - Human-in-the-Loop AI for HVAC Management Enhancing Comfort and Energy Efficiency [10.01352946835079]
HVACの性能を最適化するHuman-in-the-Loop(HITL)人工知能フレームワークを提案する。
生活水準や快適度に関する事前定義された情報を必要とする従来のシステムとは異なり、我々のアプローチは進行中のユーザ入力に基づいて学習し、適応する。
占有予測モデルと強化学習を統合することにより、運用効率を改善し、電力市場のダイナミクスに合わせてエネルギーコストを削減できる。
論文 参考訳(メタデータ) (2025-05-09T05:23:37Z) - Explainable Reinforcement Learning-based Home Energy Management Systems using Differentiable Decision Trees [4.573008040057806]
住宅セクターは、太陽光発電、家庭用バッテリー、EVの採用の増加により、柔軟性を損なう主要かつ未解決の源となっている。
微分可能な決定木を用いた強化学習に基づくアプローチを提案する。
このアプローチは、データ駆動強化学習のスケーラビリティと(微分可能)決定木の説明可能性を統合する。
概念実証として,家庭内エネルギー管理問題を用いて提案手法を解析し,その性能を市販のルールベースベースラインと標準ニューラルネットワークベースRLコントローラと比較した。
論文 参考訳(メタデータ) (2024-03-18T16:40:41Z) - Empowering Aggregators with Practical Data-Driven Tools: Harnessing Aggregated and Disaggregated Flexibility for Demand Response [37.69303106863453]
本研究は,要求応答(DR)プログラムを通じて,アグリゲータと建物利用者の柔軟性の活性化における相互作用について検討する。
限られたデータを持つ環境において、集約された柔軟性の提供戦略を最適化する手法を導入する。
論文 参考訳(メタデータ) (2024-01-19T14:43:04Z) - Laxity-Aware Scalable Reinforcement Learning for HVAC Control [2.0625936401496237]
我々は,各操作要求の緊急レベルを定量化するために,遅延の概念を活用することにより,モデリングと制御における次元問題の呪いに取り組む。
本研究では,多くのHVACシステムに対する2段階のエネルギー最適化手法を提案する。
論文 参考訳(メタデータ) (2023-06-29T01:28:14Z) - Distributed Energy Management and Demand Response in Smart Grids: A
Multi-Agent Deep Reinforcement Learning Framework [53.97223237572147]
本稿では、自律制御と再生可能エネルギー資源のスマート電力グリッドシステムへの統合のための多エージェント深層強化学習(DRL)フレームワークを提案する。
特に,提案フレームワークは,住宅利用者に対する需要応答 (DR) と分散エネルギー管理 (DEM) を共同で検討している。
論文 参考訳(メタデータ) (2022-11-29T01:18:58Z) - Enforcing Policy Feasibility Constraints through Differentiable
Projection for Energy Optimization [57.88118988775461]
本稿では,ニューラルポリシー内での凸操作制約を強制するために,PROF(Projected Feasibility)を提案する。
エネルギー効率の高い建築操作とインバータ制御の2つの応用についてPROFを実証する。
論文 参考訳(メタデータ) (2021-05-19T01:58:10Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Learning Robust Hybrid Control Barrier Functions for Uncertain Systems [68.30783663518821]
我々は,ロバストな安全を確保する制御則を合成する手段として,ロバストなハイブリッド制御障壁関数を提案する。
この概念に基づき,データからロバストなハイブリッド制御障壁関数を学習するための最適化問題を定式化する。
我々の技術は、モデル不確実性の対象となるコンパス歩行歩行者の魅力領域を安全に拡張することを可能にする。
論文 参考訳(メタデータ) (2021-01-16T17:53:35Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。