論文の概要: Employing Federated Learning for Training Autonomous HVAC Systems
- arxiv url: http://arxiv.org/abs/2405.00389v1
- Date: Wed, 1 May 2024 08:42:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-02 16:17:22.281020
- Title: Employing Federated Learning for Training Autonomous HVAC Systems
- Title(参考訳): 自律型HVACシステムの訓練におけるフェデレーションラーニングの活用
- Authors: Fredrik Hagström, Vikas Garg, Fabricio Oliveira,
- Abstract要約: ビルは世界のエネルギー消費の40%を占めている。
スマートでエネルギー効率のよいHVACシステムを実装することは、気候変動の進行に大きな影響を与える可能性がある。
モデルなし強化学習アルゴリズムは、エネルギーコストと消費、および熱的快適性において古典的なコントローラよりも優れていることが示されている。
- 参考スコア(独自算出の注目度): 3.4137115855910767
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Buildings account for 40 % of global energy consumption. A considerable portion of building energy consumption stems from heating, ventilation, and air conditioning (HVAC), and thus implementing smart, energy-efficient HVAC systems has the potential to significantly impact the course of climate change. In recent years, model-free reinforcement learning algorithms have been increasingly assessed for this purpose due to their ability to learn and adapt purely from experience. They have been shown to outperform classical controllers in terms of energy cost and consumption, as well as thermal comfort. However, their weakness lies in their relatively poor data efficiency, requiring long periods of training to reach acceptable policies, making them inapplicable to real-world controllers directly. Hence, common research goals are to improve the learning speed, as well as to improve their ability to generalize, in order to facilitate transfer learning to unseen building environments. In this paper, we take a federated learning approach to training the reinforcement learning controller of an HVAC system. A global control policy is learned by aggregating local policies trained on multiple data centers located in different climate zones. The goal of the policy is to simultaneously minimize energy consumption and maximize thermal comfort. The federated optimization strategy indirectly increases both the rate at which experience data is collected and the variation in the data. We demonstrate through experimental evaluation that these effects lead to a faster learning speed, as well as greater generalization capabilities in the federated policy compared to any individually trained policy.
- Abstract(参考訳): ビルは世界のエネルギー消費の40%を占めている。
建設エネルギー消費のかなりの部分は、暖房、換気、空調(HVAC)に起因するため、スマートでエネルギー効率のよいHVACシステムを実装することは、気候変動の進行に大きな影響を与える可能性がある。
近年、モデルなし強化学習アルゴリズムは、経験から純粋に学習し適応する能力のために、この目的のためにますます評価されている。
それらは、エネルギーコストと消費、および熱的快適性の点で古典的なコントローラーよりも優れていることが示されている。
しかし、その弱点はデータ効率の低さにあるため、許容できるポリシーに到達するためには長期間のトレーニングが必要であり、現実世界のコントローラに直接適用できない。
したがって、一般的な研究目標は、学習速度の向上と、その一般化能力の向上であり、見当たらない建築環境への学習の移行を容易にすることである。
本稿では,HVACシステムの強化学習制御を訓練するために,連合学習アプローチを採用する。
グローバルコントロールポリシは、異なる気候圏に位置する複数のデータセンタでトレーニングされたローカルポリシを集約することによって学習される。
この政策の目標は、エネルギー消費を同時に最小化し、熱的快適性を最大化することである。
フェデレーション最適化戦略は、経験データが収集される率とデータの変動の両方を間接的に増加させる。
実験により,これらの効果が学習速度の向上につながること,および,個別に訓練された政策と比較して,連合政策における一般化能力の向上を実証した。
関連論文リスト
- Real-World Data and Calibrated Simulation Suite for Offline Training of Reinforcement Learning Agents to Optimize Energy and Emission in Buildings for Environmental Sustainability [2.7624021966289605]
本稿では,実オフィスビルにおけるデバイスの実測から抽出した,オープンソースの対話型HVAC制御データセットについて紹介する。
使いやすくするために、私たちのRL環境は、すべてOpenAIのジム環境標準と互換性があります。
論文 参考訳(メタデータ) (2024-10-02T06:30:07Z) - Global Transformer Architecture for Indoor Room Temperature Forecasting [49.32130498861987]
本研究は,多室ビルにおける室内温度予測のためのグローバルトランスフォーマーアーキテクチャを提案する。
エネルギー消費を最適化し、HVACシステムに関連する温室効果ガス排出を削減することを目的としている。
本研究は,マルチルームビルにおける室内温度予測にトランスフォーマーアーキテクチャを適用した最初の事例である。
論文 参考訳(メタデータ) (2023-10-31T14:09:32Z) - Laxity-Aware Scalable Reinforcement Learning for HVAC Control [2.0625936401496237]
我々は,各操作要求の緊急レベルを定量化するために,遅延の概念を活用することにより,モデリングと制御における次元問題の呪いに取り組む。
本研究では,多くのHVACシステムに対する2段階のエネルギー最適化手法を提案する。
論文 参考訳(メタデータ) (2023-06-29T01:28:14Z) - Flexible Attention-Based Multi-Policy Fusion for Efficient Deep
Reinforcement Learning [78.31888150539258]
強化学習(RL)エージェントは、長い間、人間の学習の効率にアプローチしようとしてきた。
RLにおける以前の研究は、エージェントがサンプル効率を改善するために外部知識ポリシーを取り入れていた。
我々は,複数の知識ポリシーを融合させたRLパラダイムであるKGRL(Knowledge-Grounded RL)について述べる。
論文 参考訳(メタデータ) (2022-10-07T17:56:57Z) - Low Emission Building Control with Zero-Shot Reinforcement Learning [70.70479436076238]
強化学習(RL)による制御は、建築エネルギー効率を著しく向上させることが示されている。
我々は、ゼロショットビルディング制御と呼ばれるパラダイムを優先せずに、排出削減ポリシーを得られることを示す。
論文 参考訳(メタデータ) (2022-08-12T17:13:25Z) - A Framework for Energy and Carbon Footprint Analysis of Distributed and
Federated Edge Learning [48.63610479916003]
本稿では,分散学習政策の環境フットプリントに影響を与える要因を概説し,分析する。
バニラとコンセンサスによって駆動される分散FLポリシーの両方をモデル化する。
その結果、flは低ビット/ジュール効率を特徴とするワイヤレスシステムにおいて、顕著なエンドツーエンドの省エネ(30%-40%)が可能となった。
論文 参考訳(メタデータ) (2021-03-18T16:04:42Z) - AI Chiller: An Open IoT Cloud Based Machine Learning Framework for the
Energy Saving of Building HVAC System via Big Data Analytics on the Fusion of
BMS and Environmental Data [12.681421165031576]
建物における省エネルギーと二酸化炭素排出量削減は気候変動対策の鍵となる手段の一つである。
シラーシステムの電力消費の最適化は、機械工学と建築サービス領域で広く研究されてきた。
ビッグデータとAIの進歩により、最適化問題への機械学習の採用が人気を集めている。
論文 参考訳(メタデータ) (2020-10-09T09:51:03Z) - One for Many: Transfer Learning for Building HVAC Control [24.78264822089494]
本稿では,この課題を克服するために,トランスファーラーニングに基づく新しいアプローチを提案する。
本手法は,ソースビルディング用に訓練されたDRLベースのHVACコントローラを,最小限の労力で目標ビルディング用のコントローラに効果的に転送し,性能を向上する。
論文 参考訳(メタデータ) (2020-08-09T01:32:37Z) - A Relearning Approach to Reinforcement Learning for Control of Smart
Buildings [1.8799681615947088]
本稿では、漸進的深層学習(RL)を用いた制御方針の連続的再学習が、非定常過程におけるポリシー学習を改善することを実証する。
我々は,全体の快適さを犠牲にすることなく,建築エネルギーを同時に削減するインクリメンタルRL技術を開発した。
論文 参考訳(メタデータ) (2020-08-04T23:31:05Z) - Data-driven control of micro-climate in buildings: an event-triggered
reinforcement learning approach [56.22460188003505]
半マルコフ決定過程に基づく微小気候制御問題を定式化する。
建物内の微小気候のイベントトリガー制御のための2つの学習アルゴリズムを提案する。
スマートなサーモスタットを設計することで,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2020-01-28T18:20:43Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。