論文の概要: BEAR: Physics-Principled Building Environment for Control and
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2211.14744v1
- Date: Sun, 27 Nov 2022 06:36:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 22:56:47.398372
- Title: BEAR: Physics-Principled Building Environment for Control and
Reinforcement Learning
- Title(参考訳): BEAR:制御・強化学習のための物理原理建築環境
- Authors: Chi Zhang, Yuanyuan Shi, Yize Chen
- Abstract要約: BEARは制御強化学習のための物理を基礎とした建築環境である。
研究者はモデルベースとモデルフリーの両方のコントローラを、外部ビルディングシミュレータを併用することなく、Pythonの標準ビルディングモデルの広範なコレクションを使用してベンチマークすることができる。
モデル予測制御(MPC)と2つのケーススタディを持つ最先端RL法の両方を含む,異なるコントローラによるBEARの互換性と性能を実証する。
- 参考スコア(独自算出の注目度): 9.66911049633598
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in reinforcement learning algorithms have opened doors
for researchers to operate and optimize building energy management systems
autonomously. However, the lack of an easily configurable building dynamical
model and energy management task simulation and evaluation platform has
arguably slowed the progress in developing advanced and dedicated reinforcement
learning (RL) and control algorithms for building operation tasks. Here we
propose "BEAR", a physics-principled Building Environment for Control And
Reinforcement Learning. The platform allows researchers to benchmark both
model-based and model-free controllers using a broad collection of standard
building models in Python without co-simulation using external building
simulators. In this paper, we discuss the design of this platform and compare
it with other existing building simulation frameworks. We demonstrate the
compatibility and performance of BEAR with different controllers, including
both model predictive control (MPC) and several state-of-the-art RL methods
with two case studies.
- Abstract(参考訳): 近年の強化学習アルゴリズムの進歩は、研究者が自律的に建設エネルギー管理システムを運用し最適化するための扉を開いた。
しかし、容易に構成可能なビルディングダイナミックモデルとエネルギー管理タスクシミュレーションと評価プラットフォームが欠如していることは、高度な強化学習(RL)と運用タスク構築のための制御アルゴリズムの開発の進捗を鈍化させている。
本稿では,制御強化学習のための物理原理的建築環境であるBEARを提案する。
このプラットフォームでは、外部ビルディングシミュレータを併用することなく、Pythonの標準ビルディングモデルの広範なコレクションを使用して、モデルベースとモデルフリーの両方のコントローラをベンチマークすることができる。
本稿では,このプラットフォームの設計について検討し,他の建築シミュレーションフレームワークと比較する。
モデル予測制御(MPC)と2つのケーススタディを持つ最先端RL法の両方を含む,異なるコントローラによるBEARの互換性と性能を示す。
関連論文リスト
- Hierarchical and Decoupled BEV Perception Learning Framework for Autonomous Driving [52.808273563372126]
本稿では,基本認識モジュールとユーザフレンドリなグラフィカルインタフェースのライブラリの提供を目的とした,新しい階層的BEV知覚パラダイムを提案する。
我々は,大規模公開データセットと合理化開発プロセスを効果的に活用するために,Pretrain-Finetune戦略を実行している。
また、マルチモジュールラーニング(MML)アプローチを提案し、複数のモデルの相乗的かつ反復的な訓練により性能を向上させる。
論文 参考訳(メタデータ) (2024-07-17T11:17:20Z) - Benchmarking Model Predictive Control Algorithms in Building Optimization Testing Framework (BOPTEST) [40.17692290400862]
物理に基づく建築エミュレータのためのデータ駆動モデリングおよび制御フレームワークを提案する。
a)モデル評価を加速し、コスト効率の良い勾配を提供し、モデル予測制御(MPC)における後退地平線に対する良好な予測精度を維持する、微分可能な代理モデルのオフライントレーニング。
ビルディング最適化テストフレームワーク(BOPTEST)で利用可能な様々なテストケースに対して、複数のサロゲートモデルと最適化フレームワークを用いて、モデリングと制御性能を広範囲に評価する。
論文 参考訳(メタデータ) (2023-01-31T06:55:19Z) - Exploring Deep Reinforcement Learning for Holistic Smart Building
Control [3.463438487417909]
我々はOCTOPUSと呼ばれるシステムを開発し、データ駆動方式を用いてすべての建物のサブシステムの最適制御シーケンスを探索する。
OCTOPUSは、LEEDゴールド認定ビルにおける最先端のルールベースの手法と比較して14.26%と8.1%の省エネを達成できる。
論文 参考訳(メタデータ) (2023-01-27T03:03:21Z) - A Dynamic Feedforward Control Strategy for Energy-efficient Building
System Operation [59.56144813928478]
現在の制御戦略と最適化アルゴリズムでは、そのほとんどはリアルタイムフィードバックから情報を受け取ることに依存している。
本稿では,システム制御のためのシステム特性を同時に構築することによる,ダイナミックな事前知識を組み込む,エンジニアフレンドリな制御戦略フレームワークを提案する。
典型的な制御戦略でシステム制御を加熱するケースでテストしたところ、我々のフレームワークは15%の省エネ性を持っていることがわかった。
論文 参考訳(メタデータ) (2023-01-23T09:07:07Z) - GEM: Group Enhanced Model for Learning Dynamical Control Systems [78.56159072162103]
サンプルベースの学習が可能な効果的なダイナミクスモデルを構築します。
リー代数ベクトル空間上のダイナミクスの学習は、直接状態遷移モデルを学ぶよりも効果的であることを示す。
この研究は、ダイナミクスの学習とリー群の性質の関連性を明らかにし、新たな研究の方向への扉を開く。
論文 参考訳(メタデータ) (2021-04-07T01:08:18Z) - Learning to Fly -- a Gym Environment with PyBullet Physics for
Reinforcement Learning of Multi-agent Quadcopter Control [0.0]
本稿では,Bullet物理エンジンに基づく複数クワッドコプターのオープンソース環境を提案する。
マルチエージェントおよびビジョンベースの強化学習インターフェース、および現実的な衝突と空力効果のサポートは、私たちの知識の最高に、その種の最初のものにします。
論文 参考訳(メタデータ) (2021-03-03T02:47:59Z) - Sim-Env: Decoupling OpenAI Gym Environments from Simulation Models [0.0]
強化学習(RL)は、AI研究の最も活発な分野の1つです。
開発方法論はまだ遅れており、RLアプリケーションの開発を促進するための標準APIが不足している。
多目的エージェントベースのモデルと派生した単一目的強化学習環境の分離開発と保守のためのワークフローとツールを提示する。
論文 参考訳(メタデータ) (2021-02-19T09:25:21Z) - Learning Discrete Energy-based Models via Auxiliary-variable Local
Exploration [130.89746032163106]
離散構造データに対する条件付きおよび非条件付きEMMを学習するための新しいアルゴリズムであるALOEを提案する。
エネルギー関数とサンプリング器は、新しい変分型電力繰り返しにより効率よく訓練できることを示す。
本稿では、ソフトウェアテストのためのエネルギーモデルガイド付ファジィザについて、libfuzzerのようなよく設計されたファジィエンジンに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2020-11-10T19:31:29Z) - A Sequential Modelling Approach for Indoor Temperature Prediction and
Heating Control in Smart Buildings [4.759925918369102]
本稿では,室内温度の予測にデータ駆動統計手法を逐次適用するための学習ベースフレームワークを提案する。
実験では、モデリングアプローチと制御アルゴリズムの有効性を実証し、スマートビルディングアプリケーションにおける混合データ駆動アプローチの有望な可能性を明らかにする。
論文 参考訳(メタデータ) (2020-09-21T13:20:27Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。