論文の概要: A Relearning Approach to Reinforcement Learning for Control of Smart
Buildings
- arxiv url: http://arxiv.org/abs/2008.01879v1
- Date: Tue, 4 Aug 2020 23:31:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 01:17:18.932190
- Title: A Relearning Approach to Reinforcement Learning for Control of Smart
Buildings
- Title(参考訳): スマートビル制御のための強化学習への再学習アプローチ
- Authors: Avisek Naug and Marcos Qui\~nones-Grueiro and Gautam Biswas
- Abstract要約: 本稿では、漸進的深層学習(RL)を用いた制御方針の連続的再学習が、非定常過程におけるポリシー学習を改善することを実証する。
我々は,全体の快適さを犠牲にすることなく,建築エネルギーを同時に削減するインクリメンタルRL技術を開発した。
- 参考スコア(独自算出の注目度): 1.8799681615947088
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper demonstrates that continual relearning of control policies using
incremental deep reinforcement learning (RL) can improve policy learning for
non-stationary processes. We demonstrate this approach for a data-driven 'smart
building environment' that we use as a test-bed for developing HVAC controllers
for reducing energy consumption of large buildings on our university campus.
The non-stationarity in building operations and weather patterns makes it
imperative to develop control strategies that are adaptive to changing
conditions. On-policy RL algorithms, such as Proximal Policy Optimization (PPO)
represent an approach for addressing this non-stationarity, but exploration on
the actual system is not an option for safety-critical systems. As an
alternative, we develop an incremental RL technique that simultaneously reduces
building energy consumption without sacrificing overall comfort. We compare the
performance of our incremental RL controller to that of a static RL controller
that does not implement the relearning function. The performance of the static
controller diminishes significantly over time, but the relearning controller
adjusts to changing conditions while ensuring comfort and optimal energy
performance.
- Abstract(参考訳): 本稿では,インクリメンタル深層強化学習(rl)を用いた制御方針の継続的再学習が,非定常プロセスに対する方針学習を改善することを実証する。
本研究では, 大学構内における大規模建築物のエネルギー消費削減のためのHVACコントローラ開発のためのテストベッドとして, データ駆動型「スマートビルディング環境」の構築を実証する。
建築作業と気象パターンの非定常性は、変化する条件に適応する制御戦略を開発することが不可欠である。
ppo(proximal policy optimization)のようなオンポリシーrlアルゴリズムは、この非定常性に対処するためのアプローチを表しているが、実際のシステムに対する探索は安全クリティカルなシステムのための選択肢ではない。
代替として,全体の快適さを犠牲にすることなく建設エネルギーを同時に削減するインクリメンタルRL技術を開発した。
本稿では,再学習機能を実装しない静的RLコントローラとインクリメンタルRLコントローラの性能を比較した。
静的コントローラの性能は時間とともに大幅に低下するが、リラーニングコントローラは快適性と最適なエネルギー性能を確保しながら、条件変化に適応する。
関連論文リスト
- Deployable Reinforcement Learning with Variable Control Rate [14.838483990647697]
可変制御率を持つ強化学習(RL)の変種を提案する。
このアプローチでは、ポリシーは、エージェントが取るべきアクションと、そのアクションに関連する時間ステップの期間を決定する。
ニュートンキネマティクスを用いたエージェントを駆動する概念実証シミュレーションによりSEACの有効性を示す。
論文 参考訳(メタデータ) (2024-01-17T15:40:11Z) - Action-Quantized Offline Reinforcement Learning for Robotic Skill
Learning [68.16998247593209]
オフライン強化学習(RL)パラダイムは、静的な行動データセットを、データを収集したポリシーよりも優れたパフォーマンスのポリシーに変換するためのレシピを提供する。
本稿では,アクション量子化のための適応型スキームを提案する。
IQL,CQL,BRACといった最先端のオフラインRL手法が,提案手法と組み合わせることで,ベンチマークのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-10-18T06:07:10Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - Efficient Learning of Voltage Control Strategies via Model-based Deep
Reinforcement Learning [9.936452412191326]
本稿では,電力系統の短期電圧安定性問題に対する緊急制御戦略を設計するためのモデルベース深部強化学習(DRL)手法を提案する。
近年, モデルフリーDRL方式の電力系統への適用が期待できるが, モデルフリー方式はサンプル効率の低下と訓練時間に悩まされている。
本稿では,Deep Neural Network(DNN)に基づく動的代理モデルを用いた新しいモデルベースDRLフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-06T02:50:53Z) - Steady-State Error Compensation in Reference Tracking and Disturbance
Rejection Problems for Reinforcement Learning-Based Control [0.9023847175654602]
強化学習(Reinforcement Learning, RL)は、自動制御アプリケーションにおける将来的なトピックである。
アクター批判に基づくRLコントローラのためのイニシアティブアクション状態拡張(IASA)が導入される。
この拡張は専門家の知識を必要とせず、アプローチモデルを無償にしておく。
論文 参考訳(メタデータ) (2022-01-31T16:29:19Z) - Improving Robustness of Reinforcement Learning for Power System Control
with Adversarial Training [71.7750435554693]
電力系統制御のために提案された最先端のRLエージェントが敵攻撃に対して脆弱であることを示す。
具体的には、敵のマルコフ決定プロセスを用いて攻撃方針を学習し、攻撃の有効性を実証する。
本稿では,RLエージェントの攻撃に対する堅牢性を高め,実行不可能な運用上の決定を回避するために,敵の訓練を利用することを提案する。
論文 参考訳(メタデータ) (2021-10-18T00:50:34Z) - Development of a Soft Actor Critic Deep Reinforcement Learning Approach
for Harnessing Energy Flexibility in a Large Office Building [0.0]
本研究は,Soft Actor Critic'(SAC)に基づくDeep Reinforcement Learning(DRL)の新規適用と研究に関するものである。
SACは、連続的なアクションスペースを処理できるモデルフリーのDRL技術です。
論文 参考訳(メタデータ) (2021-04-25T10:33:35Z) - Regularizing Action Policies for Smooth Control with Reinforcement
Learning [47.312768123967025]
Conditioning for Action Policy Smoothness(CAPS)は、アクションポリシーの効果的な直感的な正規化である。
capsは、ニューラルネットワークコントローラの学習状態-動作マッピングの滑らかさを一貫して改善する。
実システムでテストしたところ、クアドロタードローンのコントローラーの滑らかさが改善され、消費電力は80%近く削減された。
論文 参考訳(メタデータ) (2020-12-11T21:35:24Z) - Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot
Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。
誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文 参考訳(メタデータ) (2020-02-22T10:15:53Z) - Data-driven control of micro-climate in buildings: an event-triggered
reinforcement learning approach [56.22460188003505]
半マルコフ決定過程に基づく微小気候制御問題を定式化する。
建物内の微小気候のイベントトリガー制御のための2つの学習アルゴリズムを提案する。
スマートなサーモスタットを設計することで,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2020-01-28T18:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。