Fugu-MT 論文翻訳(概要): Simulation Studies on Deep Reinforcement Learning for Building Control with Human Interaction

論文の概要: Simulation Studies on Deep Reinforcement Learning for Building Control with Human Interaction

arxiv url: http://arxiv.org/abs/2103.07919v1
Date: Sun, 14 Mar 2021 13:04:04 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-16 13:51:42.823598
Title: Simulation Studies on Deep Reinforcement Learning for Building Control with Human Interaction
Title（参考訳）: 人的相互作用による建物制御のための深層強化学習のシミュレーション研究
Authors: Donghwan Lee, Niao He, Seungjae Lee, Panagiota Karava, Jianghai Hu
Abstract要約: 本研究の目的は,気候制御問題構築における強化学習の可能性を評価することである。 DDPGと呼ばれる最近のRLアプローチを連続的なビルディング制御タスクに適用する。シミュレーション研究を通じて、DDPGが学んだポリシーは、合理的な性能と計算的トラクタビリティを示す。
参考スコア（独自算出の注目度）: 31.894068904706113
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The building sector consumes the largest energy in the world, and there have been considerable research interests in energy consumption and comfort management of buildings. Inspired by recent advances in reinforcement learning (RL), this paper aims at assessing the potential of RL in building climate control problems with occupant interaction. We apply a recent RL approach, called DDPG (deep deterministic policy gradient), for the continuous building control tasks and assess its performance with simulation studies in terms of its ability to handle (a) the partial state observability due to sensor limitations; (b) complex stochastic system with high-dimensional state-spaces, which are jointly continuous and discrete; (c) uncertainties due to ambient weather conditions, occupant's behavior, and comfort feelings. Especially, the partial observability and uncertainty due to the occupant interaction significantly complicate the control problem. Through simulation studies, the policy learned by DDPG demonstrates reasonable performance and computational tractability.
Abstract（参考訳）: 建築部門は世界最大のエネルギーを消費しており、建物のエネルギー消費と快適管理にかなりの研究関心が寄せられています。近年の強化学習 (RL) の進展に触発されて, 気候制御問題構築におけるRLの可能性を評価することを目的とした。本研究では,連続建物制御タスクに対してddpg(deep deterministic policy gradient)と呼ばれる最近のrlアプローチを適用し,センサ制限による部分的状態観測可能性の処理能力,(b)連続的かつ離散的な高次元状態空間を有する複雑な確率システム,(c)環境条件による不確実性,居住者の行動,快適感についてシミュレーション研究を行い,その性能を評価する。特に、占有者間相互作用による部分的可観測性と不確実性は、制御問題を著しく複雑化する。シミュレーション研究を通じて、DDPGが学んだポリシーは、合理的な性能と計算的トラクタビリティを示す。

関連論文リスト

Rediscovering Entropy Regularization: Adaptive Coefficient Unlocks Its Potential for LLM Reinforcement Learning [55.59724323303857]
本稿では,3つのコンポーネントによる探索と利用のバランスをとるフレームワークを提案する。複数の数学的推論ベンチマークの実験は、AERが一貫してベースラインを上回り、推論精度と探索能力の両方を改善していることを示している。
論文参考訳（メタデータ） (2025-10-13T03:10:26Z)
Goal Discovery with Causal Capacity for Efficient Reinforcement Learning [85.28685202281918]
因果推論は人間が世界を探検するのに不可欠である。本稿では,効率的な環境探索のための新たなゴールディスカバリーと因果容量フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-13T08:54:56Z)
BEAVER: Building Environments with Assessable Variation for Evaluating Multi-Objective Reinforcement Learning [4.342241136871849]
制御タスク構築において、一般化可能な強化学習アルゴリズムの評価を容易にするための新しいベンチマークを開発する。この結果から,既存の多目的RL法は相反する目的間の合理的なトレードオフを達成できることが示唆された。
論文参考訳（メタデータ） (2025-07-10T13:54:38Z)
Control of Renewable Energy Communities using AI and Real-World Data [0.0]
本稿では,これらの複雑さを明示的に扱えるよう設計したフレームワークを導入し,シミュレーションと現実のギャップを埋める。それは、MADDベースのマルチエージェント制御戦略であるEnergAIzeを取り入れ、現実世界のデータ収集、システム統合、ユーザー行動モデリングに関連する課題に特に対処する。
論文参考訳（メタデータ） (2025-05-22T22:20:09Z)
A Cognitive-Mechanistic Human Reliability Analysis Framework: A Nuclear Power Plant Case Study [7.583754429526051]
本研究では,IDHEAS-ECA方法論を強化する認知機械的枠組み(COGMIF)を提案する。 ACT-Rベースのヒューマンデジタルツイン(HDT)とTimeGAN強化シミュレーションを統合している。 TimeGANはACT-R生成時系列データに基づいてトレーニングされ、高忠実な合成演算子挙動データセットを生成する。
論文参考訳（メタデータ） (2025-04-25T00:46:00Z)
Experimental evaluation of offline reinforcement learning for HVAC control in buildings [12.542463083734614]
建物における動的HVAC制御のために, 強化学習(RL)技術がますます研究されている。本稿では,最先端のオフラインRLアルゴリズムの長所と短所を包括的に評価する。
論文参考訳（メタデータ） (2024-08-15T07:25:52Z)
AI-Driven approach for sustainable extraction of earth's subsurface renewable energy while minimizing seismic activity [44.99833362998488]
地球の地殻に流体を注入すると、地震を誘発または引き起こすことがある。本研究では,人間による震度制御のための強化学習に基づく新しい手法を提案する。本研究では,強化学習アルゴリズムが頑健な制御器と効率的に対話可能であることを示す。
論文参考訳（メタデータ） (2024-08-07T10:06:04Z)
Variable-Agnostic Causal Exploration for Reinforcement Learning [56.52768265734155]
強化学習のための新しいフレームワークVACERL(Variable-Agnostic Causal Exploration for Reinforcement Learning)を導入する。本手法は,注目機構を用いて,重要変数に関連する重要な観測行動ステップを自動的に同定する。これらのステップを接続する因果グラフを構築し、エージェントをタスク完了に対する因果的影響の大きい観察-作用ペアへと導く。
論文参考訳（メタデータ） (2024-07-17T09:45:27Z)
Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文参考訳（メタデータ） (2024-04-05T17:58:37Z)
Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文参考訳（メタデータ） (2024-02-04T15:54:03Z)
Staged Reinforcement Learning for Complex Tasks through Decomposed Environments [4.883558259729863]
RL問題を実問題に近似する2つの方法について議論する。交通ジャンクションシミュレーションの文脈において、複雑なタスクを複数のサブタスクに分解できれば、これらのタスクを最初に解くのが有利であることを示す。多エージェントの観点から、我々は、CTDE(Centralized Training Decentralized Execution)と呼ばれる一般的なパラダイムの下で学んだ経験の活用を活用するトレーニング構造化機構を導入する。
論文参考訳（メタデータ） (2023-11-05T19:43:23Z)
Latent Exploration for Reinforcement Learning [87.42776741119653]
強化学習では、エージェントは環境を探索し、相互作用することでポリシーを学ぶ。 LATent TIme-Correlated Exploration (Lattice)を提案する。
論文参考訳（メタデータ） (2023-05-31T17:40:43Z)
Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。我々は、切り離された潜在的想像力に基づいて政策最適化を行う。これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文参考訳（メタデータ） (2023-03-27T02:55:56Z)
Development of a Soft Actor Critic Deep Reinforcement Learning Approach for Harnessing Energy Flexibility in a Large Office Building [0.0]
本研究は,Soft Actor Critic'(SAC)に基づくDeep Reinforcement Learning(DRL)の新規適用と研究に関するものである。 SACは、連続的なアクションスペースを処理できるモデルフリーのDRL技術です。
論文参考訳（メタデータ） (2021-04-25T10:33:35Z)
Data-driven control of micro-climate in buildings: an event-triggered reinforcement learning approach [56.22460188003505]
半マルコフ決定過程に基づく微小気候制御問題を定式化する。建物内の微小気候のイベントトリガー制御のための2つの学習アルゴリズムを提案する。スマートなサーモスタットを設計することで,提案手法の有効性を示す。
論文参考訳（メタデータ） (2020-01-28T18:20:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。