論文の概要: Safe Reinforcement Learning for Grid Voltage Control
- arxiv url: http://arxiv.org/abs/2112.01484v1
- Date: Thu, 2 Dec 2021 18:34:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-03 17:28:18.647145
- Title: Safe Reinforcement Learning for Grid Voltage Control
- Title(参考訳): グリッド電圧制御のための安全強化学習
- Authors: Thanh Long Vu, Sayak Mukherjee, Renke Huang, Qiuhua Huang
- Abstract要約: 緊急時の電力系統の電圧安定性を回復するための標準手法として, 電圧負荷低減が検討されている。
本稿では,制約付き最適化手法とバリア関数に基づく2つの新しい安全なRL手法について論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Under voltage load shedding has been considered as a standard approach to
recover the voltage stability of the electric power grid under emergency
conditions, yet this scheme usually trips a massive amount of load
inefficiently. Reinforcement learning (RL) has been adopted as a promising
approach to circumvent the issues; however, RL approach usually cannot
guarantee the safety of the systems under control. In this paper, we discuss a
couple of novel safe RL approaches, namely constrained optimization approach
and Barrier function-based approach, that can safely recover voltage under
emergency events. This method is general and can be applied to other
safety-critical control problems. Numerical simulations on the 39-bus IEEE
benchmark are performed to demonstrate the effectiveness of the proposed safe
RL emergency control.
- Abstract(参考訳): 電力系統の電圧安定度を緊急時に回復するための標準的手法として電圧負荷緩和法が検討されているが、この方式は通常、大量の負荷を非効率に処理する。
強化学習(RL)は、この問題を回避するための有望なアプローチとして採用されているが、RLアプローチは通常、制御中のシステムの安全性を保証することはできない。
本稿では,緊急時の電圧を安全に回復する,制約付き最適化アプローチとバリア関数に基づくアプローチの2つの新しい安全RL手法について論じる。
この方法は一般的であり、他の安全性-クリティカルな制御問題にも適用できる。
39-bus IEEEベンチマークの数値シミュレーションを行い、提案した安全RL緊急制御の有効性を実証した。
関連論文リスト
- Safety through Permissibility: Shield Construction for Fast and Safe Reinforcement Learning [57.84059344739159]
シールドディング」は、強化学習(RL)の安全性を強制する一般的な手法である
安全と遮蔽構造に対処する新しい許容性に基づく枠組みを提案する。
論文 参考訳(メタデータ) (2024-05-29T18:00:21Z) - Reinforcement Learning with Adaptive Regularization for Safe Control of Critical Systems [2.126171264016785]
安全なRL探索を可能にするアルゴリズムである適応正規化(RL-AR)を提案する。
RL-ARは「フォーカスモジュール」を介してポリシーの組み合わせを行い、状態に応じて適切な組み合わせを決定する。
一連のクリティカルコントロールアプリケーションにおいて、RL-ARはトレーニング中の安全性を保証するだけでなく、モデルフリーなRLの標準との競合も得ることを示した。
論文 参考訳(メタデータ) (2024-04-23T16:35:14Z) - Sampling-based Safe Reinforcement Learning for Nonlinear Dynamical
Systems [15.863561935347692]
非線形力学系の制御のための安全かつ収束性のある強化学習アルゴリズムを開発した。
制御とRLの交差点における最近の進歩は、ハードセーフティ制約を強制するための2段階の安全フィルタアプローチに従っている。
我々は,古典的な収束保証を享受するRLコントローラを学習する,一段階のサンプリングに基づくハード制約満足度へのアプローチを開発する。
論文 参考訳(メタデータ) (2024-03-06T19:39:20Z) - Bayesian Reinforcement Learning for Automatic Voltage Control under
Cyber-Induced Uncertainty [0.533024001730262]
本研究では,電力系統制御問題に対するベイズ強化学習(BRL)手法を提案する。
サイバー攻撃環境における不確実性の下での持続的な電圧制御に焦点を当てている。
BRL技術は、様々なRL技術における探索と利用のしきい値を自動的に見つけるのに役立つ。
論文 参考訳(メタデータ) (2023-05-25T20:58:08Z) - Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement
Learning in Unknown Stochastic Environments [84.3830478851369]
本研究では,環境を協調的に学習し,制御ポリシーを最適化する安全な強化学習手法を提案する。
本手法は, 安全性の制約を効果的に適用し, シミュレーションにより測定したシステム安全率においてCMDPベースのベースライン法を著しく上回っている。
論文 参考訳(メタデータ) (2022-09-29T20:49:25Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Safe reinforcement learning for multi-energy management systems with
known constraint functions [0.0]
強化学習(Reinforcement Learning, RL)は, 多エネルギー管理システムにおける最適制御手法である。
我々はSafeFallbackとGiveSafeという2つの新しい安全なRL手法を提案する。
シミュレーションされたマルチエネルギーシステムのケーススタディでは、どちらの手法も非常に高い実用性から始めることを示した。
論文 参考訳(メタデータ) (2022-07-08T11:33:53Z) - Safe Reinforcement Learning via Confidence-Based Filters [78.39359694273575]
我々は,標準的な強化学習技術を用いて学習した名目政策に対して,国家安全の制約を認定するための制御理論的アプローチを開発する。
我々は、正式な安全保証を提供し、我々のアプローチの有効性を実証的に実証する。
論文 参考訳(メタデータ) (2022-07-04T11:43:23Z) - Enhancing Safe Exploration Using Safety State Augmentation [71.00929878212382]
モデルフリー強化学習における安全な探索の課題に取り組む。
トレーニング中に安全予算をスケジューリングするためのポリシーを導出します。
Simmer はトレーニングを安定させ,安全RL の性能を平均的制約で向上させることができることを示す。
論文 参考訳(メタデータ) (2022-06-06T15:23:07Z) - Contingency-constrained economic dispatch with safe reinforcement learning [7.133681867718039]
強化学習ベース(RL)コントローラはこの課題に対処できるが、それ自体が安全保証を提供することはできない。
本稿では,経済派遣のための公式なRLコントローラを提案する。
従来の制約を時間依存制約によって拡張する。
安全でないアクションは安全なアクション空間に投影され、制約付きゾノトペ集合表現を計算効率に活用する。
論文 参考訳(メタデータ) (2022-05-12T16:52:48Z) - Learning Robust Hybrid Control Barrier Functions for Uncertain Systems [68.30783663518821]
我々は,ロバストな安全を確保する制御則を合成する手段として,ロバストなハイブリッド制御障壁関数を提案する。
この概念に基づき,データからロバストなハイブリッド制御障壁関数を学習するための最適化問題を定式化する。
我々の技術は、モデル不確実性の対象となるコンパス歩行歩行者の魅力領域を安全に拡張することを可能にする。
論文 参考訳(メタデータ) (2021-01-16T17:53:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。