論文の概要: One for Many: Transfer Learning for Building HVAC Control
- arxiv url: http://arxiv.org/abs/2008.03625v2
- Date: Tue, 20 Oct 2020 01:00:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 04:42:36.377501
- Title: One for Many: Transfer Learning for Building HVAC Control
- Title(参考訳): 多くの人にとって:HVAC制御構築のためのトランスファーラーニング
- Authors: Shichao Xu, Yixuan Wang, Yanzhi Wang, Zheng O'Neill, Qi Zhu
- Abstract要約: 本稿では,この課題を克服するために,トランスファーラーニングに基づく新しいアプローチを提案する。
本手法は,ソースビルディング用に訓練されたDRLベースのHVACコントローラを,最小限の労力で目標ビルディング用のコントローラに効果的に転送し,性能を向上する。
- 参考スコア(独自算出の注目度): 24.78264822089494
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The design of building heating, ventilation, and air conditioning (HVAC)
system is critically important, as it accounts for around half of building
energy consumption and directly affects occupant comfort, productivity, and
health. Traditional HVAC control methods are typically based on creating
explicit physical models for building thermal dynamics, which often require
significant effort to develop and are difficult to achieve sufficient accuracy
and efficiency for runtime building control and scalability for field
implementations. Recently, deep reinforcement learning (DRL) has emerged as a
promising data-driven method that provides good control performance without
analyzing physical models at runtime. However, a major challenge to DRL (and
many other data-driven learning methods) is the long training time it takes to
reach the desired performance. In this work, we present a novel transfer
learning based approach to overcome this challenge. Our approach can
effectively transfer a DRL-based HVAC controller trained for the source
building to a controller for the target building with minimal effort and
improved performance, by decomposing the design of neural network controller
into a transferable front-end network that captures building-agnostic behavior
and a back-end network that can be efficiently trained for each specific
building. We conducted experiments on a variety of transfer scenarios between
buildings with different sizes, numbers of thermal zones, materials and
layouts, air conditioner types, and ambient weather conditions. The
experimental results demonstrated the effectiveness of our approach in
significantly reducing the training time, energy cost, and temperature
violations.
- Abstract(参考訳): ビルの暖房、換気、空調システム(HVAC)の設計は、建築エネルギー消費の約半分を占め、住民の快適さ、生産性、健康に直接影響を及ぼすため、極めて重要である。
従来のHVAC制御法は通常、熱力学を構築するための明示的な物理モデルを作成することに基づいており、しばしば開発に多大な労力を要し、実行時の制御とフィールド実装のスケーラビリティのために十分な精度と効率を達成するのが困難である。
近年,深部強化学習 (DRL) は,実行時に物理モデルを分析することなく良好な制御性能を提供する,有望なデータ駆動型手法として出現している。
しかし、DRL(および他の多くのデータ駆動学習手法)に対する大きな課題は、所望のパフォーマンスに到達するのに長いトレーニング時間である。
本稿では,この課題を克服するための新しいトランスファー学習手法を提案する。
提案手法は, ニューラルネットワークコントローラの設計を移動可能なフロントエンドネットワークに分解することで, ソースビルディング用に訓練されたDRLベースのHVACコントローラを, 最小限の労力で目標ビルディング用のコントローラに効果的に転送し, 性能を向上させる。
異なる大きさの建物間での移動シナリオ,温度帯の数,材料とレイアウト,空調タイプ,環境条件などについて実験を行った。
実験の結果, トレーニング時間, エネルギーコスト, 温度違反を著しく低減する手法の有効性が示された。
関連論文リスト
- Real-World Data and Calibrated Simulation Suite for Offline Training of Reinforcement Learning Agents to Optimize Energy and Emission in Buildings for Environmental Sustainability [2.7624021966289605]
本稿では,実オフィスビルにおけるデバイスの実測から抽出した,オープンソースの対話型HVAC制御データセットについて紹介する。
使いやすくするために、私たちのRL環境は、すべてOpenAIのジム環境標準と互換性があります。
論文 参考訳(メタデータ) (2024-10-02T06:30:07Z) - Continual Diffuser (CoD): Mastering Continual Offline Reinforcement Learning with Experience Rehearsal [54.93261535899478]
強化学習のロボット制御のような現実世界の応用では、タスクが変化し、新しいタスクが順次発生する。
この状況は、タスクの変更に適応し、獲得した知識を保持するエージェントを訓練する上で、可塑性-安定トレードオフという新たな課題を生じさせる。
本研究では,連続拡散器(Continuous diffuser,CoD)と呼ばれるリハーサルに基づく連続拡散モデルを提案する。
論文 参考訳(メタデータ) (2024-09-04T08:21:47Z) - Employing Federated Learning for Training Autonomous HVAC Systems [3.4137115855910767]
ビルは世界のエネルギー消費の40%を占めている。
スマートでエネルギー効率のよいHVACシステムを実装することは、気候変動の進行に大きな影響を与える可能性がある。
モデルなし強化学習アルゴリズムは、エネルギーコストと消費、および熱的快適性において古典的なコントローラよりも優れていることが示されている。
論文 参考訳(メタデータ) (2024-05-01T08:42:22Z) - Efficient Data-Driven MPC for Demand Response of Commercial Buildings [0.0]
小型商業ビルにおけるエネルギー管理のためのデータ駆動型・混合整数入札戦略を提案する。
屋上ユニットの暖房, 個別制御による空調システムについて検討し, 商業ビルの運転を正確にモデル化する。
当社のアプローチをいくつかの需要応答(DR)設定に適用する。
論文 参考訳(メタデータ) (2024-01-28T20:01:44Z) - Global Transformer Architecture for Indoor Room Temperature Forecasting [49.32130498861987]
本研究は,多室ビルにおける室内温度予測のためのグローバルトランスフォーマーアーキテクチャを提案する。
エネルギー消費を最適化し、HVACシステムに関連する温室効果ガス排出を削減することを目的としている。
本研究は,マルチルームビルにおける室内温度予測にトランスフォーマーアーキテクチャを適用した最初の事例である。
論文 参考訳(メタデータ) (2023-10-31T14:09:32Z) - Low Emission Building Control with Zero-Shot Reinforcement Learning [70.70479436076238]
強化学習(RL)による制御は、建築エネルギー効率を著しく向上させることが示されている。
我々は、ゼロショットビルディング制御と呼ばれるパラダイムを優先せずに、排出削減ポリシーを得られることを示す。
論文 参考訳(メタデータ) (2022-08-12T17:13:25Z) - DL-DRL: A double-level deep reinforcement learning approach for
large-scale task scheduling of multi-UAV [65.07776277630228]
分割・征服フレームワーク(DCF)に基づく二重レベル深層強化学習(DL-DRL)手法を提案する。
特に,上層部DRLモデルにおけるエンコーダ・デコーダ構成ポリシネットワークを設計し,タスクを異なるUAVに割り当てる。
また、低レベルDRLモデルにおける別の注意に基づくポリシーネットワークを利用して、各UAVの経路を構築し、実行されたタスク数を最大化する。
論文 参考訳(メタデータ) (2022-08-04T04:35:53Z) - Development of a Soft Actor Critic Deep Reinforcement Learning Approach
for Harnessing Energy Flexibility in a Large Office Building [0.0]
本研究は,Soft Actor Critic'(SAC)に基づくDeep Reinforcement Learning(DRL)の新規適用と研究に関するものである。
SACは、連続的なアクションスペースを処理できるモデルフリーのDRL技術です。
論文 参考訳(メタデータ) (2021-04-25T10:33:35Z) - Efficient Transformers in Reinforcement Learning using Actor-Learner
Distillation [91.05073136215886]
「Actor-Learner Distillation」は、大容量学習者モデルから小容量学習者モデルへ学習の進捗を移す。
Actor-Learner Distillation を用いて,トランスフォーマー学習モデルの明確なサンプル効率向上を再現する,いくつかの挑戦的なメモリ環境を実証する。
論文 参考訳(メタデータ) (2021-04-04T17:56:34Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。