論文の概要: A Centralised Soft Actor Critic Deep Reinforcement Learning Approach to
District Demand Side Management through CityLearn
- arxiv url: http://arxiv.org/abs/2009.10562v1
- Date: Tue, 22 Sep 2020 14:03:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 21:51:22.683195
- Title: A Centralised Soft Actor Critic Deep Reinforcement Learning Approach to
District Demand Side Management through CityLearn
- Title(参考訳): 中心化ソフトアクター批判的深層強化学習による都市学習による地域需要側管理
- Authors: Anjukan Kathirgamanathan, Kacper Twardowski, Eleni Mangina, Donal Finn
- Abstract要約: 強化学習は、需要側管理のための有望なモデルフリーで適応的なコントローラである。
本稿では,CityLearn Challengeに提出されたアルゴリズムの結果について述べる。
提案手法は,集中型「ソフトアクター批判」深部強化学習エージェントを用いて,課題において第2位を確保した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning is a promising model-free and adaptive controller for
demand side management, as part of the future smart grid, at the district
level. This paper presents the results of the algorithm that was submitted for
the CityLearn Challenge, which was hosted in early 2020 with the aim of
designing and tuning a reinforcement learning agent to flatten and smooth the
aggregated curve of electrical demand of a district of diverse buildings. The
proposed solution secured second place in the challenge using a centralised
'Soft Actor Critic' deep reinforcement learning agent that was able to handle
continuous action spaces. The controller was able to achieve an averaged score
of 0.967 on the challenge dataset comprising of different buildings and
climates. This highlights the potential application of deep reinforcement
learning as a plug-and-play style controller, that is capable of handling
different climates and a heterogenous building stock, for district demand side
management of buildings.
- Abstract(参考訳): 強化学習は、将来のスマートグリッドの一部として、地区レベルで需要側管理のためのモデルフリーかつ適応型コントローラである。
本稿では,2020年初頭に開催されていたCityLearn Challengeに提出されたアルゴリズムの結果について,各種建築物の電気的需要の集約曲線を平坦化し円滑にするために,強化学習エージェントを設計・調整することを目的とした。
提案手法は,連続的な行動空間を扱える集中型「ソフトアクター批判」深部強化学習エージェントを用いて,課題の2位を確保した。
コントローラは、異なる建物と気候からなるチャレンジデータセットで平均0.967点を達成した。
このことは、異なる気候と異質なビルのストックを扱えるプラグアンドプレイ型コントローラとしての深層強化学習を、地区需要側で建物を管理できる可能性を強調している。
関連論文リスト
- A Distributed ADMM-based Deep Learning Approach for Thermal Control in Multi-Zone Buildings under Demand Response Events [1.1126342180866646]
本研究では,ADMMを用いた分散最適化と深層学習モデルを組み合わせて室内温度設定点を効果的に計画する。
上層に中央建物コーディネータ、熱ゾーン層にローカルコントローラを備えた2層階層構造を用いる。
提案するアルゴリズムはDistributed Planning Networksと呼ばれ、様々なタイプの建物に適応可能かつスケーラブルに設計されている。
論文 参考訳(メタデータ) (2023-12-08T14:46:50Z) - Specialized Deep Residual Policy Safe Reinforcement Learning-Based
Controller for Complex and Continuous State-Action Spaces [1.3678669691302048]
ランダムに探索することは不可能であり、従来のコントローラーをブラックボックスモデルに置き換えることは望ましくない。
本稿では,複雑かつ連続的な状態対応空間に適応した学習手法を応用した,高度残効政策安全な強化学習を提案する。
論文 参考訳(メタデータ) (2023-10-15T21:53:23Z) - MERLIN: Multi-agent offline and transfer learning for occupant-centric
energy flexible operation of grid-interactive communities using smart meter
data and CityLearn [0.0]
ビルの脱炭は, 送電網の信頼性に新たな課題をもたらす。
我々は,MERLINフレームワークを提案し,CityLearnの現実的なグリッド・インタラクティブな住宅コミュニティのデジタルツインを利用する。
電池の独立型RL制御器は、個々の建物に対するポリシーを調整することによって、基準よりも建物や地区レベルが向上することを示す。
論文 参考訳(メタデータ) (2022-12-31T21:37:14Z) - Human-instructed Deep Hierarchical Generative Learning for Automated
Urban Planning [57.91323079939641]
我々は,最適な都市計画を生成するために,人間に指示された新しい深層階層生成モデルを構築した。
最初の段階は、機能ゾーンを発見するために、目標領域の格子に遅延関数をラベル付けすることである。
第2の段階は、都市機能投影を形成するための計画要件を理解することである。
第3の段階は、マルチアテンションを活用して、機能プロジェクションのゾーン・ゾーン・ピア依存関係をモデル化し、グリッドレベルの土地利用構成を生成することである。
論文 参考訳(メタデータ) (2022-12-01T23:06:41Z) - Learning to Walk Autonomously via Reset-Free Quality-Diversity [73.08073762433376]
品質多様性アルゴリズムは、多様かつ高いパフォーマンスのスキルからなる大規模で複雑な行動レパートリーを発見することができる。
既存のQDアルゴリズムは、手動による人間の監督と介入を必要とするエピソードリセットと同様に、多数の評価を必要とする。
本稿では,オープンエンド環境におけるロボットの自律学習に向けたステップとして,リセットフリー品質多様性最適化(RF-QD)を提案する。
論文 参考訳(メタデータ) (2022-04-07T14:07:51Z) - Curriculum Based Reinforcement Learning of Grid Topology Controllers to
Prevent Thermal Cascading [0.19116784879310028]
本稿では,電力系統演算子のドメイン知識を強化学習フレームワークに統合する方法について述べる。
環境を改良することにより、報酬チューニングを伴うカリキュラムベースのアプローチをトレーニング手順に組み込む。
複数のシナリオに対する並列トレーニングアプローチは、エージェントをいくつかのシナリオに偏りなくし、グリッド操作の自然変動に対して堅牢にするために使用される。
論文 参考訳(メタデータ) (2021-12-18T20:32:05Z) - Real-world challenges for reinforcement learning in building control [0.0]
そこで我々は,強化学習型ビルディングコントローラにおける実世界の9つの課題を提案する。
我々はこの枠組みで制御研究を構築するべきであると論じている。
論文 参考訳(メタデータ) (2021-11-25T02:59:53Z) - Ada-Segment: Automated Multi-loss Adaptation for Panoptic Segmentation [95.31590177308482]
我々は,トレーニング期間中に複数のトレーニング損失を柔軟に調整する自動マルチロス適応(ada-segment)を提案する。
エンドツーエンドアーキテクチャにより、ada-segmentはハイパーパラメータを再チューニングすることなく、異なるデータセットに一般化する。
Ada-Segmentは、バニラベースラインからCOCOval分割に2.7%のパノラマ品質(PQ)改善をもたらし、COCOテストデブ分割に最新の48.5%PQ、ADE20Kデータセットに32.9%PQを達成しました。
論文 参考訳(メタデータ) (2020-12-07T11:43:10Z) - Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning
for Smart Grids [56.35173057183362]
家庭用家電をネットでスケジュールできるスマートメーターが各家庭に備わっている需要側エネルギー管理の問題点を考察する。
目標は、リアルタイムの料金体系の下で全体のコストを最小化することです。
マルコフゲームとしてスマートグリッド環境の定式化を提案する。
論文 参考訳(メタデータ) (2020-05-05T07:32:40Z) - Data-driven control of micro-climate in buildings: an event-triggered
reinforcement learning approach [56.22460188003505]
半マルコフ決定過程に基づく微小気候制御問題を定式化する。
建物内の微小気候のイベントトリガー制御のための2つの学習アルゴリズムを提案する。
スマートなサーモスタットを設計することで,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2020-01-28T18:20:43Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。