論文の概要: Demand response for residential building heating: Effective Monte Carlo Tree Search control based on physics-informed neural networks
- arxiv url: http://arxiv.org/abs/2312.03365v4
- Date: Tue, 21 May 2024 14:56:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-22 18:51:19.488929
- Title: Demand response for residential building heating: Effective Monte Carlo Tree Search control based on physics-informed neural networks
- Title(参考訳): 住宅の暖房に対する需要応答:物理インフォームドニューラルネットワークに基づく効率的なモンテカルロ木探索制御
- Authors: Fabio Pavirani, Gargya Gokhale, Bert Claessens, Chris Develder,
- Abstract要約: 本稿では,住宅の暖房システムのエネルギー消費を抑えるために,需要応答(DR)アルゴリズムを用いることに焦点をあてる。
そのようなRL手法の1つはMCTS(Monte Carlo Tree Search)であり、ボードゲーム(ゴー、チェス)で素晴らしい成功を収めている。
- 参考スコア(独自算出の注目度): 4.1860949813005375
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To reduce global carbon emissions and limit climate change, controlling energy consumption in buildings is an important piece of the puzzle. Here, we specifically focus on using a demand response (DR) algorithm to limit the energy consumption of a residential building's heating system while respecting user's thermal comfort. In that domain, Reinforcement learning (RL) methods have been shown to be quite effective. One such RL method is Monte Carlo Tree Search (MCTS), which has achieved impressive success in playing board games (go, chess). A particular advantage of MCTS is that its decision tree structure naturally allows to integrate exogenous constraints (e.g., by trimming branches that violate them), while conventional RL solutions need more elaborate techniques (e.g., indirectly by adding penalties in the cost/reward function, or through a backup controller that corrects constraint-violating actions). The main aim of this paper is to study the adoption of MCTS for building control, since this (to the best of our knowledge) has remained largely unexplored. A specific property of MCTS is that it needs a simulator component that can predict subsequent system states, based on actions taken. A straightforward data-driven solution is to use black-box neural networks (NNs). We will however extend a Physics-informed Neural Network (PiNN) model to deliver multi-timestep predictions, and show the benefit it offers in terms of lower prediction errors ($-$32\% MAE) as well as better MCTS performance ($-$4\% energy cost, $+$7\% thermal comfort) compared to a black-box NN. A second contribution will be to extend a vanilla MCTS version to adopt the ideas applied in AlphaZero (i.e., using learned prior and value functions and an action selection heuristic) to obtain lower computational costs while maintaining control performance.
- Abstract(参考訳): 地球規模の二酸化炭素排出量を削減し、気候変動を抑えるため、建物内のエネルギー消費を抑えることがパズルの重要なピースである。
本稿では,利用者の熱的快適さを尊重しつつ,住宅の暖房システムのエネルギー消費を抑えるために,需要応答(DR)アルゴリズムの使用に着目する。
この領域では、強化学習(RL)法は非常に効果的であることが示されている。
そのようなRL手法の1つはMCTS(Monte Carlo Tree Search)であり、ボードゲーム(ゴー、チェス)で驚くべき成功を収めた。
MCTSの特に利点は、決定木構造が自然に外在的制約(例えば、それらに違反する枝をトリミングすることで)を統合することができるのに対し、従来のRLソリューションはより精巧な技術(例えば、コスト/リワード関数に罰則を間接的に追加したり、制約違反行為を修正するバックアップコントローラを通して)を必要とすることである。
本論文の主な目的は,建築制御におけるMCTSの採用について検討することである。
MCTSの特定の特性は、実行されたアクションに基づいてその後のシステム状態を予測できるシミュレータコンポーネントが必要であることである。
簡単なデータ駆動ソリューションは、ブラックボックスニューラルネットワーク(NN)を使用することだ。
しかしながら、我々は、マルチステップ予測を提供するために物理情報ニューラルネットワーク(PiNN)モデルを拡張し、予測エラー(-32\% MAE)やMCTSのパフォーマンス(-4\%エネルギーコスト、+7\%熱的快適性)をブラックボックスNNと比較した場合の利点を示す。
第2の貢献は、AlphaZeroで適用されたアイデア(すなわち、学習前の関数と値関数とアクション選択ヒューリスティック)を採用するためにバニラMCTSバージョンを拡張して、制御性能を維持しながら計算コストを下げることである。
関連論文リスト
- Can Large Language Models Play Games? A Case Study of A Self-Play
Approach [61.15761840203145]
LLM(Large Language Models)は、インターネットからの広範なデータを利用して、幅広い事前知識を格納する。
Monte-Carlo Tree Search (MCTS)は、信頼性の高い意思決定ソリューションを提供する検索アルゴリズムである。
この研究は、ターンベースのゼロサムゲームを効率的に解決するために、MCTSセルフプレイでLLMを活性化させる革新的なアプローチを導入している。
論文 参考訳(メタデータ) (2024-03-08T19:16:29Z) - Efficient Data-Driven MPC for Demand Response of Commercial Buildings [0.0]
小型商業ビルにおけるエネルギー管理のためのデータ駆動型・混合整数入札戦略を提案する。
屋上ユニットの暖房, 個別制御による空調システムについて検討し, 商業ビルの運転を正確にモデル化する。
当社のアプローチをいくつかの需要応答(DR)設定に適用する。
論文 参考訳(メタデータ) (2024-01-28T20:01:44Z) - Model-based Causal Bayesian Optimization [74.78486244786083]
乗算重み付き因果ベイズ最適化のための最初のアルゴリズム(CBO-MW)を提案する。
グラフ関連の量に自然に依存するCBO-MWに対する後悔の限界を導出する。
我々の実験は、共有モビリティシステムにおいて、ユーザの需要パターンを学習するためにCBO-MWをどのように使用できるかの現実的なデモを含む。
論文 参考訳(メタデータ) (2023-07-31T13:02:36Z) - Movement Penalized Bayesian Optimization with Application to Wind Energy
Systems [84.7485307269572]
文脈ベイズ最適化(CBO)は、与えられた側情報を逐次決定する強力なフレームワークである。
この設定では、学習者は各ラウンドでコンテキスト(天気条件など)を受け取り、アクション(タービンパラメータなど)を選択する必要がある。
標準的なアルゴリズムは、すべてのラウンドで意思決定を切り替えるコストを前提としませんが、多くの実用的なアプリケーションでは、このような変更に関連するコストが最小化されるべきです。
論文 参考訳(メタデータ) (2022-10-14T20:19:32Z) - Monte Carlo Augmented Actor-Critic for Sparse Reward Deep Reinforcement
Learning from Suboptimal Demonstrations [17.08814685657957]
Monte Carlo Augmented Actor Critic (MCAC) は、標準的なアクター・アクター・アクター・クリティカル・アルゴリズムに対するパラメータフリーな修正である。
MCACは、標準時間距離(TD)目標とモンテカルロの推定値の最大値を取ることで、修正された$Q$-値を計算する。
5ドルの連続制御ドメインに対する実験は、MCACが6ドルの一般的なRLおよびRL-from-demonstrationsアルゴリズムで学習効率を大幅に向上させる可能性があることを示唆している。
論文 参考訳(メタデータ) (2022-10-14T00:23:37Z) - Low Emission Building Control with Zero-Shot Reinforcement Learning [70.70479436076238]
強化学習(RL)による制御は、建築エネルギー効率を著しく向上させることが示されている。
我々は、ゼロショットビルディング制御と呼ばれるパラダイムを優先せずに、排出削減ポリシーを得られることを示す。
論文 参考訳(メタデータ) (2022-08-12T17:13:25Z) - Input Convex Neural Networks for Building MPC [3.7597202216941783]
我々は,複数ステップ先進予測のための凸入出力関係を実現するために,入力凸ニューラルネットワークに追加制約を導入する。
2つの5日間の冷却実験において、入力凸ニューラルネットワークを用いたMPCは、冷却エネルギー消費を最小限に抑えながら室温を快適な制約内に保持することができる。
論文 参考訳(メタデータ) (2020-11-26T10:51:50Z) - Controlling Rayleigh-B\'enard convection via Reinforcement Learning [62.997667081978825]
固定外熱勾配下での対流熱交換を抑制または促進するための効果的な制御戦略の同定は、重要な基本的かつ技術的問題である。
本研究では,最先端の強化学習(RL)アルゴリズムに基づく新しい手法を提案する。
我々のRL制御は導電系を安定させ、対流の開始をレイリー数にすることができることを示す。
論文 参考訳(メタデータ) (2020-03-31T16:39:25Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。