論文の概要: A Lightweight Calibrated Simulation Enabling Efficient Offline Learning
for Optimal Control of Real Buildings
- arxiv url: http://arxiv.org/abs/2310.08569v1
- Date: Thu, 12 Oct 2023 17:56:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-15 10:31:17.248232
- Title: A Lightweight Calibrated Simulation Enabling Efficient Offline Learning
for Optimal Control of Real Buildings
- Title(参考訳): 実建物の最適制御のための効率的なオフライン学習を実現する軽量校正シミュレーション
- Authors: Judah Goldfeder, John Sipple
- Abstract要約: 強化学習モデルを学習するためのシミュレーションに基づく新しい手法を提案する。
当社のオープンソースシミュレーターは軽量で、ビルからのテレメトリによってキャリブレーションされ、より高い忠実度に到達しています。
このアプローチは多くの建物に拡張可能な実世界のRL制御システムを実現するための重要なステップである。
- 参考スコア(独自算出の注目度): 3.2634122554914002
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern commercial Heating, Ventilation, and Air Conditioning (HVAC) devices
form a complex and interconnected thermodynamic system with the building and
outside weather conditions, and current setpoint control policies are not fully
optimized for minimizing energy use and carbon emission. Given a suitable
training environment, a Reinforcement Learning (RL) model is able to improve
upon these policies, but training such a model, especially in a way that scales
to thousands of buildings, presents many real world challenges. We propose a
novel simulation-based approach, where a customized simulator is used to train
the agent for each building. Our open-source simulator (available online:
https://github.com/google/sbsim) is lightweight and calibrated via telemetry
from the building to reach a higher level of fidelity. On a two-story, 68,000
square foot building, with 127 devices, we were able to calibrate our simulator
to have just over half a degree of drift from the real world over a six-hour
interval. This approach is an important step toward having a real-world RL
control system that can be scaled to many buildings, allowing for greater
efficiency and resulting in reduced energy consumption and carbon emissions.
- Abstract(参考訳): 現代の商業用暖房・換気・空調(HVAC)装置は、ビルや外部の気象条件と複雑で相互接続した熱力学システムを形成しており、現在のセットポイント制御ポリシーはエネルギー使用量や二酸化炭素排出量を最小化するために完全に最適化されていない。
適切なトレーニング環境が与えられると、強化学習(rl)モデルはこれらのポリシーを改善することができるが、そのようなモデルをトレーニングすることは、特に数千の建物にスケールする方法で、多くの現実世界の課題をもたらす。
本稿では,建物毎にカスタマイズしたシミュレータを用いてエージェントを訓練する新しいシミュレーションベース手法を提案する。
当社のオープンソースシミュレータ(オンライン: https://github.com/google/sbsim)は軽量で、ビルからのテレメトリによって高度に調整されています。
2階建ての6万8000平方フィートのビルで、127台のデバイスを使って、シミュレーターを6時間間隔で現実世界から半度以上漂流させるように調整しました。
このアプローチは多くの建物にスケール可能な実世界のRL制御システムを構築するための重要なステップであり、それによって効率が向上し、エネルギー消費と二酸化炭素排出量が減少する。
関連論文リスト
- Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - Exploring Deep Reinforcement Learning for Holistic Smart Building
Control [3.463438487417909]
我々はOCTOPUSと呼ばれるシステムを開発し、データ駆動方式を用いてすべての建物のサブシステムの最適制御シーケンスを探索する。
OCTOPUSは、LEEDゴールド認定ビルにおける最先端のルールベースの手法と比較して14.26%と8.1%の省エネを達成できる。
論文 参考訳(メタデータ) (2023-01-27T03:03:21Z) - Parallel Reinforcement Learning Simulation for Visual Quadrotor
Navigation [4.597465975849579]
強化学習(Reinforcement Learning、RL)は、ロボットに物理的な世界の中をナビゲートするように教えるエージェントベースのアプローチである。
本稿では,AirSim上に構築された並列学習を効率的に行うシミュレーションフレームワークを提案する。
このフレームワーク上に構築されたApe-Xは、AirSim環境の分散トレーニングを組み込むように修正されている。
論文 参考訳(メタデータ) (2022-09-22T15:27:42Z) - Low Emission Building Control with Zero-Shot Reinforcement Learning [70.70479436076238]
強化学習(RL)による制御は、建築エネルギー効率を著しく向上させることが示されている。
我々は、ゼロショットビルディング制御と呼ばれるパラダイムを優先せずに、排出削減ポリシーを得られることを示す。
論文 参考訳(メタデータ) (2022-08-12T17:13:25Z) - Zero-Shot Building Control [0.0]
強化学習(RL)による制御は、建築エネルギー効率を著しく向上させることが示されている。
既存のソリューションでは、世界中のすべての建物で入手するのに非常に高価なシミュレーターを事前訓練する必要がある。
システム識別とモデルベースRLのアイデアを組み合わせることで,建物を安全かつゼロショットで制御できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:56:40Z) - Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。
本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。
現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文 参考訳(メタデータ) (2022-04-14T17:46:26Z) - Habitat 2.0: Training Home Assistants to Rearrange their Habitat [122.54624752876276]
インタラクティブな3D環境で仮想ロボットを訓練するためのシミュレーションプラットフォームHabitat 2.0(H2.0)を紹介する。
エンボディされたAIスタックのすべてのレベル – データ、シミュレーション、ベンチマークタスク – にコントリビューションを行います。
論文 参考訳(メタデータ) (2021-06-28T05:42:15Z) - One for Many: Transfer Learning for Building HVAC Control [24.78264822089494]
本稿では,この課題を克服するために,トランスファーラーニングに基づく新しいアプローチを提案する。
本手法は,ソースビルディング用に訓練されたDRLベースのHVACコントローラを,最小限の労力で目標ビルディング用のコントローラに効果的に転送し,性能を向上する。
論文 参考訳(メタデータ) (2020-08-09T01:32:37Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。