論文の概要: Data-Driven Policy Mapping for Safe RL-based Energy Management Systems
- arxiv url: http://arxiv.org/abs/2506.16352v1
- Date: Thu, 19 Jun 2025 14:29:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.113937
- Title: Data-Driven Policy Mapping for Safe RL-based Energy Management Systems
- Title(参考訳): 安全RL型エネルギー管理システムのためのデータ駆動型政策マッピング
- Authors: Theo Zangato, Aomar Osmani, Pegah Alizadeh,
- Abstract要約: 本稿では,クラスタリング,予測,制約付き政策学習を組み合わせた3段階強化学習に基づく建築エネルギー管理システム(BEMS)を提案する。
実世界のデータから評価することで,特定の建築タイプに対して,運用コストを最大15%削減する。
全体として、このフレームワークはスケーラブルで堅牢で費用対効果の高い建築エネルギー管理を提供します。
- 参考スコア(独自算出の注目度): 6.185645393091031
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Increasing global energy demand and renewable integration complexity have placed buildings at the center of sustainable energy management. We present a three-step reinforcement learning(RL)-based Building Energy Management System (BEMS) that combines clustering, forecasting, and constrained policy learning to address scalability, adaptability, and safety challenges. First, we cluster non-shiftable load profiles to identify common consumption patterns, enabling policy generalization and transfer without retraining for each new building. Next, we integrate an LSTM based forecasting module to anticipate future states, improving the RL agents' responsiveness to dynamic conditions. Lastly, domain-informed action masking ensures safe exploration and operation, preventing harmful decisions. Evaluated on real-world data, our approach reduces operating costs by up to 15% for certain building types, maintains stable environmental performance, and quickly classifies and optimizes new buildings with limited data. It also adapts to stochastic tariff changes without retraining. Overall, this framework delivers scalable, robust, and cost-effective building energy management.
- Abstract(参考訳): 世界的なエネルギー需要の増加と再生可能エネルギー統合の複雑さは、建物を持続可能なエネルギー管理の中心に位置づけている。
本稿では, クラスタリング, 予測, 制約付き政策学習を組み合わせて, 拡張性, 適応性, 安全性の課題に対処する3段階強化学習(RL)に基づくビルディングエネルギー管理システム(BEMS)を提案する。
まず、シフト不能な負荷プロファイルをクラスタ化して、一般的な消費パターンを識別し、新しい建物ごとに再トレーニングすることなく、ポリシーの一般化と転送を可能にします。
次に、LSTMベースの予測モジュールを統合し、将来の状態を予測し、RLエージェントの動的条件に対する応答性を改善する。
最後に、ドメインインフォームドアクションマスキングは安全な探索と操作を保証し、有害な決定を防ぐ。
提案手法は, 実世界のデータに基づいて, 特定の建築物の運用コストを最大15%削減し, 環境性能を安定的に維持し, 限られたデータで建物を迅速に分類・最適化する。
それはまた、再訓練することなく、確率的な関税変更に適応する。
全体として、このフレームワークはスケーラブルで堅牢で費用対効果の高い建築エネルギー管理を提供します。
関連論文リスト
- Control of Renewable Energy Communities using AI and Real-World Data [0.0]
本稿では,これらの複雑さを明示的に扱えるよう設計したフレームワークを導入し,シミュレーションと現実のギャップを埋める。
それは、MADDベースのマルチエージェント制御戦略であるEnergAIzeを取り入れ、現実世界のデータ収集、システム統合、ユーザー行動モデリングに関連する課題に特に対処する。
論文 参考訳(メタデータ) (2025-05-22T22:20:09Z) - Joint Resource Management for Energy-efficient UAV-assisted SWIPT-MEC: A Deep Reinforcement Learning Approach [50.52139512096988]
6G Internet of Things (IoT)ネットワークは、地上インフラストラクチャが利用できない遠隔地や災害シナリオにおいて、課題に直面している。
本稿では、指向性アンテナにより強化された新しい無人航空機(UAV)支援コンピューティングシステムを提案する。
論文 参考訳(メタデータ) (2025-05-06T06:46:19Z) - Explainable AI for building energy retrofitting under data scarcity [40.14307808809578]
本研究では,人工知能(AI)と機械学習(ML)を基盤として,住宅のエネルギー効率対策を推奨する枠組みを提案する。
ラトビアをケーススタディとして、この方法論は限られたデータセット、クラス不均衡、データ不足に関連する課題に対処する。
このアプローチの評価は、データ制限を顕著に克服し、精度、リコール、F1スコアの最大54%の改善を実現していることを示している。
論文 参考訳(メタデータ) (2025-04-08T14:00:08Z) - H-FLTN: A Privacy-Preserving Hierarchical Framework for Electric Vehicle Spatio-Temporal Charge Prediction [8.183121832206556]
電気自動車(EV)は、特に充電時間(時間予測)の予測において、エネルギー提供者にとって重要な課題となる
本稿では,これらの課題に対処するための階層型学習トランスフォーマーネットワークフレームワークを紹介する。
現実世界のスマートシティインフラストラクチャとの統合により、エネルギー需要予測、リソース割り当て、グリッド安定性が向上する。
論文 参考訳(メタデータ) (2025-02-25T23:20:53Z) - Reinforcement Learning-based Approach for Vehicle-to-Building Charging with Heterogeneous Agents and Long Term Rewards [3.867907469895697]
本稿では,行動マスキングとMILPによる効率的な政策ガイダンスを併用した新しいRLフレームワークを提案する。
当社のアプローチは、ユーザの充電要求を満たすために、継続的なアクションスペースの探索のバランスを取る。
提案手法は,V2Bエネルギー管理の課題を解決するための,最初のスケーラブルで汎用的なアプローチの1つである。
論文 参考訳(メタデータ) (2025-02-24T19:24:41Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - MERLIN: Multi-agent offline and transfer learning for occupant-centric
energy flexible operation of grid-interactive communities using smart meter
data and CityLearn [0.0]
ビルの脱炭は, 送電網の信頼性に新たな課題をもたらす。
我々は,MERLINフレームワークを提案し,CityLearnの現実的なグリッド・インタラクティブな住宅コミュニティのデジタルツインを利用する。
電池の独立型RL制御器は、個々の建物に対するポリシーを調整することによって、基準よりも建物や地区レベルが向上することを示す。
論文 参考訳(メタデータ) (2022-12-31T21:37:14Z) - Low Emission Building Control with Zero-Shot Reinforcement Learning [70.70479436076238]
強化学習(RL)による制御は、建築エネルギー効率を著しく向上させることが示されている。
我々は、ゼロショットビルディング制御と呼ばれるパラダイムを優先せずに、排出削減ポリシーを得られることを示す。
論文 参考訳(メタデータ) (2022-08-12T17:13:25Z) - Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable
Edge Computing Systems [87.4519172058185]
エッジコンピューティング機能を有するセルフパワー無線ネットワークの効率的なエネルギー分配機構について検討した。
定式化問題を解くために,新しいマルチエージェントメタ強化学習(MAMRL)フレームワークを提案する。
実験の結果、提案されたMAMRLモデルは、再生不可能なエネルギー使用量を最大11%削減し、エネルギーコストを22.4%削減できることが示された。
論文 参考訳(メタデータ) (2020-02-20T04:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。