論文の概要: A Comparison of Classical and Deep Reinforcement Learning Methods for
HVAC Control
- arxiv url: http://arxiv.org/abs/2308.05711v1
- Date: Thu, 10 Aug 2023 17:20:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-11 11:38:13.420214
- Title: A Comparison of Classical and Deep Reinforcement Learning Methods for
HVAC Control
- Title(参考訳): HVAC制御のための古典的・深い強化学習法の比較
- Authors: Marshall Wang, John Willes, Thomas Jiralerspong, Matin Moezzi
- Abstract要約: 複数のHVAC環境にまたがる2つの古典的およびディープなRL手法(Q-LearningとDeep-Q-Networks)をベンチマークする。
その結果, HVAC システムにおける RL エージェントの設定に関する知見が得られ, エネルギー効率, 費用対効果が向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning (RL) is a promising approach for optimizing HVAC
control. RL offers a framework for improving system performance, reducing
energy consumption, and enhancing cost efficiency. We benchmark two popular
classical and deep RL methods (Q-Learning and Deep-Q-Networks) across multiple
HVAC environments and explore the practical consideration of model
hyper-parameter selection and reward tuning. The findings provide insight for
configuring RL agents in HVAC systems, promoting energy-efficient and
cost-effective operation.
- Abstract(参考訳): 強化学習(RL)は、HVAC制御を最適化するための有望なアプローチである。
RLはシステム性能の向上、エネルギー消費の削減、コスト効率の向上のためのフレームワークを提供する。
我々は,複数のHVAC環境にまたがる古典的およびディープなRL手法(Q-LearningとDeep-Q-Networks)をベンチマークし,モデルハイパーパラメータ選択と報酬チューニングの実践的考察を行った。
その結果, HVAC システムにおける RL エージェントの設定に関する知見が得られ, エネルギー効率とコスト効率が向上した。
関連論文リスト
- Comparison of Model Predictive Control and Proximal Policy Optimization for a 1-DOF Helicopter System [0.7499722271664147]
本研究は,Quanser Aero 2システムに適用された深層強化学習(DRL)アルゴリズムであるモデル予測制御(MPC)とPPOの比較分析を行う。
PPOは上昇時間と適応性に優れており、迅速な応答と適応性を必要とするアプリケーションには有望なアプローチである。
論文 参考訳(メタデータ) (2024-08-28T08:35:34Z) - Go Beyond Black-box Policies: Rethinking the Design of Learning Agent
for Interpretable and Verifiable HVAC Control [3.326392645107372]
熱力学モデルと過去のデータから抽出した決定木を用いてHVACコントローラを再設計することでボトルネックを克服する。
本手法は68.4%のエネルギーを節約し, 人間の快適度を14.8%向上させる。
論文 参考訳(メタデータ) (2024-02-29T22:42:23Z) - Scalable Volt-VAR Optimization using RLlib-IMPALA Framework: A
Reinforcement Learning Approach [11.11570399751075]
本研究は, 深層強化学習(DRL)の可能性を活用した新しい枠組みを提案する。
DRLエージェントをRAYプラットフォームに統合することにより、RAYのリソースを効率的に利用してシステム適応性と制御を改善する新しいフレームワークであるRLlib-IMPALAの開発が容易になる。
論文 参考訳(メタデータ) (2024-02-24T23:25:35Z) - An experimental evaluation of Deep Reinforcement Learning algorithms for HVAC control [40.71019623757305]
近年の研究では、Deep Reinforcement Learning (DRL)アルゴリズムが従来のリアクティブコントローラより優れていることが示されている。
本稿では,HVAC制御のためのいくつかの最先端DRLアルゴリズムについて,批判的かつ再現可能な評価を行う。
論文 参考訳(メタデータ) (2024-01-11T08:40:26Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - Laxity-Aware Scalable Reinforcement Learning for HVAC Control [2.0625936401496237]
我々は,各操作要求の緊急レベルを定量化するために,遅延の概念を活用することにより,モデリングと制御における次元問題の呪いに取り組む。
本研究では,多くのHVACシステムに対する2段階のエネルギー最適化手法を提案する。
論文 参考訳(メタデータ) (2023-06-29T01:28:14Z) - CCE: Sample Efficient Sparse Reward Policy Learning for Robotic Navigation via Confidence-Controlled Exploration [72.24964965882783]
CCE (Confidence-Controlled Exploration) は、ロボットナビゲーションのようなスパース報酬設定のための強化学習アルゴリズムのトレーニングサンプル効率を高めるために設計された。
CCEは、勾配推定と政策エントロピーの間の新しい関係に基づいている。
我々は、CCEが一定軌跡長とエントロピー正規化を用いる従来の手法より優れるシミュレーションおよび実世界の実験を通して実証する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - Optimal Goal-Reaching Reinforcement Learning via Quasimetric Learning [73.80728148866906]
準メトリック強化学習(QRL)は、準メトリックモデルを用いて最適な値関数を学習する新しいRL法である。
オフラインおよびオンラインの目標達成ベンチマークでは、QRLはサンプル効率とパフォーマンスが改善されている。
論文 参考訳(メタデータ) (2023-04-03T17:59:58Z) - Supervised Advantage Actor-Critic for Recommender Systems [76.7066594130961]
本稿では、RL成分を学習するための負のサンプリング戦略を提案し、それを教師付き逐次学習と組み合わせる。
サンプル化された(負の)作用 (items) に基づいて、平均ケース上での正の作用の「アドバンテージ」を計算することができる。
SNQNとSA2Cを4つのシーケンシャルレコメンデーションモデルでインスタンス化し、2つの実世界のデータセットで実験を行う。
論文 参考訳(メタデータ) (2021-11-05T12:51:15Z) - Improving Robustness of Reinforcement Learning for Power System Control
with Adversarial Training [71.7750435554693]
電力系統制御のために提案された最先端のRLエージェントが敵攻撃に対して脆弱であることを示す。
具体的には、敵のマルコフ決定プロセスを用いて攻撃方針を学習し、攻撃の有効性を実証する。
本稿では,RLエージェントの攻撃に対する堅牢性を高め,実行不可能な運用上の決定を回避するために,敵の訓練を利用することを提案する。
論文 参考訳(メタデータ) (2021-10-18T00:50:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。