論文の概要: Optimizing Industrial HVAC Systems with Hierarchical Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2209.08112v1
- Date: Fri, 16 Sep 2022 18:00:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 17:35:00.638482
- Title: Optimizing Industrial HVAC Systems with Hierarchical Reinforcement
Learning
- Title(参考訳): 階層型強化学習による産業用HVACシステムの最適化
- Authors: William Wong, Praneet Dutta, Octavian Voicu, Yuri Chervonyi, Cosmin
Paduraru, Jerry Luo
- Abstract要約: 産業用冷却システムの最適化のために強化学習技術が開発され、省エネが図られている。
産業制御における大きな課題は、機械の制約により現実世界で実現可能な学習行動である。
動作時間尺度に応じて動作のサブセットを制御する複数のエージェントによる階層的強化学習を使用する。
- 参考スコア(独自算出の注目度): 1.7489518849687256
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinforcement learning (RL) techniques have been developed to optimize
industrial cooling systems, offering substantial energy savings compared to
traditional heuristic policies. A major challenge in industrial control
involves learning behaviors that are feasible in the real world due to
machinery constraints. For example, certain actions can only be executed every
few hours while other actions can be taken more frequently. Without extensive
reward engineering and experimentation, an RL agent may not learn realistic
operation of machinery. To address this, we use hierarchical reinforcement
learning with multiple agents that control subsets of actions according to
their operation time scales. Our hierarchical approach achieves energy savings
over existing baselines while maintaining constraints such as operating
chillers within safe bounds in a simulated HVAC control environment.
- Abstract(参考訳): 産業用冷却システムを最適化するために強化学習(rl)技術が開発され、従来のヒューリスティックな政策と比較してかなりの省エネルギーを提供している。
産業制御における大きな課題は、機械の制約により現実世界で実現可能な学習行動である。
例えば、特定のアクションは数時間毎にのみ実行されるが、他のアクションはより頻繁に実行される。
広範な報酬工学と実験がなければ、RLエージェントは機械の現実的な操作を学ばない。
これを解決するために,複数のエージェントによる階層的強化学習を用い,操作時間尺度に応じて動作のサブセットを制御する。
我々の階層的アプローチは、シミュレーションされたHVAC制御環境において、安全な境界内での冷却器の運転などの制約を維持しながら、既存のベースラインに対する省エネを実現する。
関連論文リスト
- GreenLight-Gym: A Reinforcement Learning Benchmark Environment for Greenhouse Crop Production Control [0.0]
強化学習(Reinforcement Learning, RL)は、温室管理を自動化するための制御ポリシーを学ぶための有望なアプローチである。
我々は,現在最先端の温室モデルであるGreenLight上でRLアルゴリズムをトレーニングし,評価するために設計された,最初のオープンソース環境であるGreenLight-Gymを紹介する。
第二に、州の境界を強制するために、乗法または加法的なペナルティを用いる2つの報酬形成アプローチを比較する。
第3に,不随意トレーニングと気象データによるRL性能の評価を行い,未知条件への一般化を実証した。
論文 参考訳(メタデータ) (2024-10-06T18:25:23Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - A Safe Reinforcement Learning Algorithm for Supervisory Control of Power
Plants [7.1771300511732585]
モデルフリー強化学習(RL)は、制御タスクのための有望なソリューションとして登場した。
本稿では,監督制御のための近似ポリシ最適化に基づく確率制約付きRLアルゴリズムを提案する。
本手法は, 原子力プラント設計における負荷追従操作において, 違反距離と違反率の最小化を実現するものである。
論文 参考訳(メタデータ) (2024-01-23T17:52:49Z) - Action-Quantized Offline Reinforcement Learning for Robotic Skill
Learning [68.16998247593209]
オフライン強化学習(RL)パラダイムは、静的な行動データセットを、データを収集したポリシーよりも優れたパフォーマンスのポリシーに変換するためのレシピを提供する。
本稿では,アクション量子化のための適応型スキームを提案する。
IQL,CQL,BRACといった最先端のオフラインRL手法が,提案手法と組み合わせることで,ベンチマークのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-10-18T06:07:10Z) - Surrogate Empowered Sim2Real Transfer of Deep Reinforcement Learning for
ORC Superheat Control [12.567922037611261]
本稿では,ORCスーパーヒート制御のためのSim2Real転送学習型DRL制御法を提案する。
実験結果から,ORC制御問題におけるDRLのトレーニング速度を大幅に向上することがわかった。
論文 参考訳(メタデータ) (2023-08-05T01:59:44Z) - Low Emission Building Control with Zero-Shot Reinforcement Learning [70.70479436076238]
強化学習(RL)による制御は、建築エネルギー効率を著しく向上させることが示されている。
我々は、ゼロショットビルディング制御と呼ばれるパラダイムを優先せずに、排出削減ポリシーを得られることを示す。
論文 参考訳(メタデータ) (2022-08-12T17:13:25Z) - Enforcing Policy Feasibility Constraints through Differentiable
Projection for Energy Optimization [57.88118988775461]
本稿では,ニューラルポリシー内での凸操作制約を強制するために,PROF(Projected Feasibility)を提案する。
エネルギー効率の高い建築操作とインバータ制御の2つの応用についてPROFを実証する。
論文 参考訳(メタデータ) (2021-05-19T01:58:10Z) - Development of a Soft Actor Critic Deep Reinforcement Learning Approach
for Harnessing Energy Flexibility in a Large Office Building [0.0]
本研究は,Soft Actor Critic'(SAC)に基づくDeep Reinforcement Learning(DRL)の新規適用と研究に関するものである。
SACは、連続的なアクションスペースを処理できるモデルフリーのDRL技術です。
論文 参考訳(メタデータ) (2021-04-25T10:33:35Z) - Efficient Transformers in Reinforcement Learning using Actor-Learner
Distillation [91.05073136215886]
「Actor-Learner Distillation」は、大容量学習者モデルから小容量学習者モデルへ学習の進捗を移す。
Actor-Learner Distillation を用いて,トランスフォーマー学習モデルの明確なサンプル効率向上を再現する,いくつかの挑戦的なメモリ環境を実証する。
論文 参考訳(メタデータ) (2021-04-04T17:56:34Z) - A Relearning Approach to Reinforcement Learning for Control of Smart
Buildings [1.8799681615947088]
本稿では、漸進的深層学習(RL)を用いた制御方針の連続的再学習が、非定常過程におけるポリシー学習を改善することを実証する。
我々は,全体の快適さを犠牲にすることなく,建築エネルギーを同時に削減するインクリメンタルRL技術を開発した。
論文 参考訳(メタデータ) (2020-08-04T23:31:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。