論文の概要: Real-world challenges for reinforcement learning in building control
- arxiv url: http://arxiv.org/abs/2112.06127v1
- Date: Thu, 25 Nov 2021 02:59:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-19 12:56:25.462902
- Title: Real-world challenges for reinforcement learning in building control
- Title(参考訳): 建築制御における強化学習の課題
- Authors: Zoltan Nagy and Kingsley Nweye
- Abstract要約: そこで我々は,強化学習型ビルディングコントローラにおける実世界の9つの課題を提案する。
我々はこの枠組みで制御研究を構築するべきであると論じている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Building upon prior research that highlighted the need for standardizing
environments for building control research, and inspired by recently introduced
benchmarks for real life reinforcement learning control, here we propose a
non-exhaustive nine real world challenges for reinforcement learning building
controller. We argue that building control research should be expressed in this
framework in addition to providing a standardized environment for
repeatability. Advanced controllers such as model predictive control and
reinforcement learning control have both advantages and disadvantages that
prevent them from being implemented in real world buildings. Comparisons
between the two are seldom, and often biased. By focusing on the benchmark
problems and challenges, we can investigate the performance of the controllers
under a variety of situations and generate a fair comparison. Lastly, we call
for a more interdisciplinary effort of the research community to address the
real world challenges, and unlock the potentials of advanced building
controllers.
- Abstract(参考訳): 建築制御研究のための環境標準化の必要性を強調し,近年導入された実生活強化学習制御のベンチマークから着想を得た先行研究に基づいて,強化学習構築制御のための9つの実世界課題を提案する。
我々は、このフレームワークで制御研究を構築することに加えて、再現性のための標準化された環境を提供することを論じる。
モデル予測制御や強化学習制御のような高度なコントローラは、現実世界の建物に実装できない利点とデメリットの両方を持っている。
両者の比較はめったになく、しばしば偏りがある。
ベンチマーク問題や課題に焦点をあてることで,様々な状況下でのコントローラの性能を調査し,公正な比較を行うことができる。
最後に、我々は、現実世界の課題に対処し、高度なビルディングコントローラの可能性を解き放つために、研究コミュニティのより学際的な取り組みを求めます。
関連論文リスト
- Specialized Deep Residual Policy Safe Reinforcement Learning-Based
Controller for Complex and Continuous State-Action Spaces [1.3678669691302048]
ランダムに探索することは不可能であり、従来のコントローラーをブラックボックスモデルに置き換えることは望ましくない。
本稿では,複雑かつ連続的な状態対応空間に適応した学習手法を応用した,高度残効政策安全な強化学習を提案する。
論文 参考訳(メタデータ) (2023-10-15T21:53:23Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - BEAR: Physics-Principled Building Environment for Control and
Reinforcement Learning [9.66911049633598]
BEARは制御強化学習のための物理を基礎とした建築環境である。
研究者はモデルベースとモデルフリーの両方のコントローラを、外部ビルディングシミュレータを併用することなく、Pythonの標準ビルディングモデルの広範なコレクションを使用してベンチマークすることができる。
モデル予測制御(MPC)と2つのケーススタディを持つ最先端RL法の両方を含む,異なるコントローラによるBEARの互換性と性能を実証する。
論文 参考訳(メタデータ) (2022-11-27T06:36:35Z) - You Only Live Once: Single-Life Reinforcement Learning [124.1738675154651]
多くの現実世界の状況では、そのタスクを繰り返し実行できるポリシーを学ぶことではなく、単一のトライアルで1回だけ新しいタスクを成功させることが目的である。
エージェントが介入なしにひとつのエピソード内でタスクを完了しなければならない問題設定を形式化する。
本稿では,分散マッチング戦略を用いたQ$-weighted adversarial Learning (QWALE)を提案する。
論文 参考訳(メタデータ) (2022-10-17T09:00:11Z) - Autonomous Reinforcement Learning: Formalism and Benchmarking [106.25788536376007]
人間や動物が行うような現実世界の具体的学習は、連続的で非エポゾディックな世界にある。
RLの一般的なベンチマークタスクはエピソジックであり、試行錯誤によってエージェントに複数の試行を行う環境がリセットされる。
この相違は、擬似環境向けに開発されたRLアルゴリズムを現実世界のプラットフォーム上で実行しようとする場合、大きな課題となる。
論文 参考訳(メタデータ) (2021-12-17T16:28:06Z) - Is Bang-Bang Control All You Need? Solving Continuous Control with
Bernoulli Policies [45.20170713261535]
我々は、訓練されたエージェントが、その空間の境界におけるアクションをしばしば好む現象を調査する。
通常のガウス分布を、各作用次元に沿った極性のみを考えるベルヌーイ分布に置き換える。
驚くべきことに、これはいくつかの継続的制御ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-11-03T22:45:55Z) - URLB: Unsupervised Reinforcement Learning Benchmark [82.36060735454647]
教師なし強化学習ベンチマーク(URLB)を紹介する。
URLBは2つのフェーズで構成されている。
評価のために3つのドメインから12の連続制御タスクを提供し、8つの主要な教師なしRLメソッドに対してオープンソースコードを提供する。
論文 参考訳(メタデータ) (2021-10-28T15:07:01Z) - safe-control-gym: a Unified Benchmark Suite for Safe Learning-based
Control and Reinforcement Learning [3.9258421820410225]
我々はSafe-control-gymと呼ばれるオープンソースのベンチマークスイートを提案する。
当社の出発点はOpenAIのGym APIで、強化学習研究における事実上の標準のひとつです。
制御性能, データの効率, 安全性を定量的に比較するために, 安全な制御ジャムをどう使うかを示す。
論文 参考訳(メタデータ) (2021-09-13T21:09:28Z) - Simulation Studies on Deep Reinforcement Learning for Building Control
with Human Interaction [31.894068904706113]
本研究の目的は,気候制御問題構築における強化学習の可能性を評価することである。
DDPGと呼ばれる最近のRLアプローチを連続的なビルディング制御タスクに適用する。
シミュレーション研究を通じて、DDPGが学んだポリシーは、合理的な性能と計算的トラクタビリティを示す。
論文 参考訳(メタデータ) (2021-03-14T13:04:04Z) - Data-driven control of micro-climate in buildings: an event-triggered
reinforcement learning approach [56.22460188003505]
半マルコフ決定過程に基づく微小気候制御問題を定式化する。
建物内の微小気候のイベントトリガー制御のための2つの学習アルゴリズムを提案する。
スマートなサーモスタットを設計することで,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2020-01-28T18:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。