論文の概要: Simulation Studies on Deep Reinforcement Learning for Building Control
with Human Interaction
- arxiv url: http://arxiv.org/abs/2103.07919v1
- Date: Sun, 14 Mar 2021 13:04:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 13:51:42.823598
- Title: Simulation Studies on Deep Reinforcement Learning for Building Control
with Human Interaction
- Title(参考訳): 人的相互作用による建物制御のための深層強化学習のシミュレーション研究
- Authors: Donghwan Lee, Niao He, Seungjae Lee, Panagiota Karava, Jianghai Hu
- Abstract要約: 本研究の目的は,気候制御問題構築における強化学習の可能性を評価することである。
DDPGと呼ばれる最近のRLアプローチを連続的なビルディング制御タスクに適用する。
シミュレーション研究を通じて、DDPGが学んだポリシーは、合理的な性能と計算的トラクタビリティを示す。
- 参考スコア(独自算出の注目度): 31.894068904706113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The building sector consumes the largest energy in the world, and there have
been considerable research interests in energy consumption and comfort
management of buildings. Inspired by recent advances in reinforcement learning
(RL), this paper aims at assessing the potential of RL in building climate
control problems with occupant interaction. We apply a recent RL approach,
called DDPG (deep deterministic policy gradient), for the continuous building
control tasks and assess its performance with simulation studies in terms of
its ability to handle (a) the partial state observability due to sensor
limitations; (b) complex stochastic system with high-dimensional state-spaces,
which are jointly continuous and discrete; (c) uncertainties due to ambient
weather conditions, occupant's behavior, and comfort feelings. Especially, the
partial observability and uncertainty due to the occupant interaction
significantly complicate the control problem. Through simulation studies, the
policy learned by DDPG demonstrates reasonable performance and computational
tractability.
- Abstract(参考訳): 建築部門は世界最大のエネルギーを消費しており、建物のエネルギー消費と快適管理にかなりの研究関心が寄せられています。
近年の強化学習 (RL) の進展に触発されて, 気候制御問題構築におけるRLの可能性を評価することを目的とした。
本研究では,連続建物制御タスクに対してddpg(deep deterministic policy gradient)と呼ばれる最近のrlアプローチを適用し,センサ制限による部分的状態観測可能性の処理能力,(b)連続的かつ離散的な高次元状態空間を有する複雑な確率システム,(c)環境条件による不確実性,居住者の行動,快適感についてシミュレーション研究を行い,その性能を評価する。
特に、占有者間相互作用による部分的可観測性と不確実性は、制御問題を著しく複雑化する。
シミュレーション研究を通じて、DDPGが学んだポリシーは、合理的な性能と計算的トラクタビリティを示す。
関連論文リスト
- Experimental evaluation of offline reinforcement learning for HVAC control in buildings [12.542463083734614]
建物における動的HVAC制御のために, 強化学習(RL)技術がますます研究されている。
本稿では,最先端のオフラインRLアルゴリズムの長所と短所を包括的に評価する。
論文 参考訳(メタデータ) (2024-08-15T07:25:52Z) - AI-Driven approach for sustainable extraction of earth's subsurface renewable energy while minimizing seismic activity [44.99833362998488]
地球の地殻に流体を注入すると、地震を誘発または引き起こすことがある。
本研究では,人間による震度制御のための強化学習に基づく新しい手法を提案する。
本研究では,強化学習アルゴリズムが頑健な制御器と効率的に対話可能であることを示す。
論文 参考訳(メタデータ) (2024-08-07T10:06:04Z) - Variable-Agnostic Causal Exploration for Reinforcement Learning [56.52768265734155]
強化学習のための新しいフレームワークVACERL(Variable-Agnostic Causal Exploration for Reinforcement Learning)を導入する。
本手法は,注目機構を用いて,重要変数に関連する重要な観測行動ステップを自動的に同定する。
これらのステップを接続する因果グラフを構築し、エージェントをタスク完了に対する因果的影響の大きい観察-作用ペアへと導く。
論文 参考訳(メタデータ) (2024-07-17T09:45:27Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Staged Reinforcement Learning for Complex Tasks through Decomposed
Environments [4.883558259729863]
RL問題を実問題に近似する2つの方法について議論する。
交通ジャンクションシミュレーションの文脈において、複雑なタスクを複数のサブタスクに分解できれば、これらのタスクを最初に解くのが有利であることを示す。
多エージェントの観点から、我々は、CTDE(Centralized Training Decentralized Execution)と呼ばれる一般的なパラダイムの下で学んだ経験の活用を活用するトレーニング構造化機構を導入する。
論文 参考訳(メタデータ) (2023-11-05T19:43:23Z) - Latent Exploration for Reinforcement Learning [87.42776741119653]
強化学習では、エージェントは環境を探索し、相互作用することでポリシーを学ぶ。
LATent TIme-Correlated Exploration (Lattice)を提案する。
論文 参考訳(メタデータ) (2023-05-31T17:40:43Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Development of a Soft Actor Critic Deep Reinforcement Learning Approach
for Harnessing Energy Flexibility in a Large Office Building [0.0]
本研究は,Soft Actor Critic'(SAC)に基づくDeep Reinforcement Learning(DRL)の新規適用と研究に関するものである。
SACは、連続的なアクションスペースを処理できるモデルフリーのDRL技術です。
論文 参考訳(メタデータ) (2021-04-25T10:33:35Z) - Data-driven control of micro-climate in buildings: an event-triggered
reinforcement learning approach [56.22460188003505]
半マルコフ決定過程に基づく微小気候制御問題を定式化する。
建物内の微小気候のイベントトリガー制御のための2つの学習アルゴリズムを提案する。
スマートなサーモスタットを設計することで,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2020-01-28T18:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。