論文の概要: Data-driven control of micro-climate in buildings: an event-triggered
reinforcement learning approach
- arxiv url: http://arxiv.org/abs/2001.10505v2
- Date: Thu, 2 Jul 2020 19:11:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 03:06:54.136050
- Title: Data-driven control of micro-climate in buildings: an event-triggered
reinforcement learning approach
- Title(参考訳): 建物における微小気候のデータ駆動制御--イベントトリガー型強化学習アプローチ
- Authors: Ashkan Haji Hosseinloo, Alexander Ryzhov, Aldo Bischi, Henni Ouerdane,
Konstantin Turitsyn, Munther A. Dahleh
- Abstract要約: 半マルコフ決定過程に基づく微小気候制御問題を定式化する。
建物内の微小気候のイベントトリガー制御のための2つの学習アルゴリズムを提案する。
スマートなサーモスタットを設計することで,提案手法の有効性を示す。
- 参考スコア(独自算出の注目度): 56.22460188003505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Smart buildings have great potential for shaping an energy-efficient,
sustainable, and more economic future for our planet as buildings account for
approximately 40% of the global energy consumption. Future of the smart
buildings lies in using sensory data for adaptive decision making and control
that is currently gloomed by the key challenge of learning a good control
policy in a short period of time in an online and continuing fashion. To tackle
this challenge, an event-triggered -- as opposed to classic time-triggered --
paradigm, is proposed in which learning and control decisions are made when
events occur and enough information is collected. Events are characterized by
certain design conditions and they occur when the conditions are met, for
instance, when a certain state threshold is reached. By systematically
adjusting the time of learning and control decisions, the proposed framework
can potentially reduce the variance in learning, and consequently, improve the
control process. We formulate the micro-climate control problem based on
semi-Markov decision processes that allow for variable-time state transitions
and decision making. Using extended policy gradient theorems and temporal
difference methods in a reinforcement learning set-up, we propose two learning
algorithms for event-triggered control of micro-climate in buildings. We show
the efficacy of our proposed approach via designing a smart learning thermostat
that simultaneously optimizes energy consumption and occupants' comfort in a
test building.
- Abstract(参考訳): スマートな建物は、地球全体のエネルギー消費の約40%を占めるため、エネルギー効率が高く、持続可能で、より経済的な未来を形作る大きな可能性を秘めている。
スマートビルの将来は、オンラインと継続的な方法で短期間で適切な制御方針を学ぶという重要な課題によって現在目立たれている、適応的意思決定と制御に感覚データを使用することにある。
この課題に取り組むために,イベントが発生し,十分な情報が収集された場合に学習と制御の判断を行う,古典的な時間トリガーとは対照的なイベントトリガー型パラダイムを提案する。
イベントは特定の設計条件によって特徴づけられ、例えば特定の状態閾値に達すると、条件が満たされたときに発生する。
学習の時間と制御の決定を体系的に調整することにより、提案フレームワークは学習のばらつきを低減し、制御プロセスを改善することができる。
変動時間状態遷移と意思決定を可能にする半マルコフ決定プロセスに基づいて,マイクロ気候制御問題を定式化する。
拡張政策勾配定理と時間差法を用いて、建物内の微小気候のイベントトリガー制御のための2つの学習アルゴリズムを提案する。
テストビルにおけるエネルギー消費と居住者の快適さを同時に最適化するスマート・ラーニング・サーモスタットの設計により,提案手法の有効性を示す。
関連論文リスト
- Pausing Policy Learning in Non-stationary Reinforcement Learning [23.147618992106867]
意思決定を継続的に更新することは、時間的ギャップを最小限にするために最適である、という共通の信念に取り組む。
我々は,オンライン強化学習フレームワークの予測を提案し,戦略的に混乱した意思決定の更新により,全体的なパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2024-05-25T04:38:09Z) - Room Occupancy Prediction: Exploring the Power of Machine Learning and
Temporal Insights [0.0]
建物内のエネルギーの保全は、温室効果ガスの排出と気候変動との戦いにとって最重要課題である。
本研究では,多様な機械学習モデルを活用するルーム占有率の予測フレームワークを提案する。
エネルギー効率の良いプラクティスとルーム占有管理を形成する上での機械学習の約束を強調します。
論文 参考訳(メタデータ) (2023-12-22T04:16:34Z) - A Stochastic Online Forecast-and-Optimize Framework for Real-Time Energy
Dispatch in Virtual Power Plants under Uncertainty [18.485617498705736]
本稿では,2つの要素から構成されるリアルタイム不確実性を考慮したエネルギー分散フレームワークを提案する。
提案するフレームワークは,リアルタイムデータ配信に迅速に適応すると同時に,データドリフトやモデルの不一致,制御プロセスの環境摂動などによる不確実性もターゲットとすることができる。
このフレームワークはCityLearn Challenge 2022で優勝し、エネルギー領域におけるAIアプリケーションの可能性を調べる影響力のある機会となった。
論文 参考訳(メタデータ) (2023-09-15T00:04:00Z) - Dichotomy of Control: Separating What You Can Control from What You
Cannot [129.62135987416164]
政策の制御(行動)と政策の制御(環境)以外のメカニズムを分離する将来の条件付き教師あり学習フレームワークを提案する。
我々は,DoCが条件付入力と整合したポリシを出力し,学習したポリシを所望のハイリターン未来結果に条件付けすることで,高リターン行動が正しく引き起こされることを示す。
論文 参考訳(メタデータ) (2022-10-24T17:49:56Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Imitating, Fast and Slow: Robust learning from demonstrations via
decision-time planning [96.72185761508668]
テストタイムでの計画(IMPLANT)は、模倣学習のための新しいメタアルゴリズムである。
IMPLANTは,標準制御環境において,ベンチマーク模倣学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-04-07T17:16:52Z) - Temporal-Difference Value Estimation via Uncertainty-Guided Soft Updates [110.92598350897192]
Q-Learningは、制御タスクを実行するポリシーを学ぶのに効果的であることが証明されている。
推定ノイズは、政策改善ステップにおける最大演算子の後、バイアスとなる。
UQL(Unbiased Soft Q-Learning)は、2つのアクション、有限状態空間からマルチアクション、無限状態マルコフ決定プロセスまで、EQLの作業を拡張する。
論文 参考訳(メタデータ) (2021-10-28T00:07:19Z) - Development of a Soft Actor Critic Deep Reinforcement Learning Approach
for Harnessing Energy Flexibility in a Large Office Building [0.0]
本研究は,Soft Actor Critic'(SAC)に基づくDeep Reinforcement Learning(DRL)の新規適用と研究に関するものである。
SACは、連続的なアクションスペースを処理できるモデルフリーのDRL技術です。
論文 参考訳(メタデータ) (2021-04-25T10:33:35Z) - A Relearning Approach to Reinforcement Learning for Control of Smart
Buildings [1.8799681615947088]
本稿では、漸進的深層学習(RL)を用いた制御方針の連続的再学習が、非定常過程におけるポリシー学習を改善することを実証する。
我々は,全体の快適さを犠牲にすることなく,建築エネルギーを同時に削減するインクリメンタルRL技術を開発した。
論文 参考訳(メタデータ) (2020-08-04T23:31:05Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。