論文の概要: Model-Free Load Frequency Control of Nonlinear Power Systems Based on
Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2403.04374v1
- Date: Thu, 7 Mar 2024 10:06:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 14:22:56.870069
- Title: Model-Free Load Frequency Control of Nonlinear Power Systems Based on
Deep Reinforcement Learning
- Title(参考訳): 深層強化学習に基づく非線形電力系統のモデルフリー負荷周波数制御
- Authors: Xiaodi Chen, Meng Zhang, Zhengguang Wu, Ligang Wu and Xiaohong Guan
- Abstract要約: 本稿では,Deep Deterministic Policy gradient (DDPG) に基づく非線形電力系統のモデルフリーLFC法を提案する。
制御器は適切な制御動作を生成でき、非線形電力系に対して強い適応性を有する。
- 参考スコア(独自算出の注目度): 29.643278858113266
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Load frequency control (LFC) is widely employed in power systems to stabilize
frequency fluctuation and guarantee power quality. However, most existing LFC
methods rely on accurate power system modeling and usually ignore the nonlinear
characteristics of the system, limiting controllers' performance. To solve
these problems, this paper proposes a model-free LFC method for nonlinear power
systems based on deep deterministic policy gradient (DDPG) framework. The
proposed method establishes an emulator network to emulate power system
dynamics. After defining the action-value function, the emulator network is
applied for control actions evaluation instead of the critic network. Then the
actor network controller is effectively optimized by estimating the policy
gradient based on zeroth-order optimization (ZOO) and backpropagation
algorithm. Simulation results and corresponding comparisons demonstrate the
designed controller can generate appropriate control actions and has strong
adaptability for nonlinear power systems.
- Abstract(参考訳): 負荷周波数制御(LFC)は、周波数変動を安定させ、電力品質を保証するために電力システムに広く用いられている。
しかし、既存のLFC手法の多くは正確な電力系統モデリングに依存しており、通常はシステムの非線形特性を無視し、制御装置の性能を制限している。
そこで本研究では,ddpg(deep deterministic policy gradient)フレームワークに基づく非線形電力システムのためのモデルフリーなlfc手法を提案する。
提案手法は,電力系統のダイナミクスをエミュレートするエミュレータネットワークを確立する。
アクション値関数を定義した後、エミュレータネットワークを批評家ネットワークの代わりに制御アクション評価に適用する。
次に、ゼロ階最適化(ZOO)とバックプロパゲーションアルゴリズムに基づいてポリシー勾配を推定することにより、アクタネットワークコントローラを効果的に最適化する。
シミュレーション結果と対応する比較により、設計したコントローラは適切な制御動作を生成でき、非線形電力システムに対して強い適応性を示す。
関連論文リスト
- A novel ANROA based control approach for grid-tied multi-functional
solar energy conversion system [0.0]
三相格子型太陽太陽光発電システムに対する適応制御手法を提案し,検討した。
適応型ニューロファジィ推論システム(ANFIS)と降雨最適化アルゴリズム(ROA)を組み合わせた。
電圧変動、高調波、フリックなどの電力品質問題や、バランスの取れない負荷や反応電力の使用などを避けることが大きな目標である。
論文 参考訳(メタデータ) (2024-01-26T09:12:39Z) - Nonlinear Control Allocation: A Learning Based Approach [0.0]
現代の航空機は、耐故障性と操縦性要件を満たすために冗長な制御エフェクターで設計されている。
これにより航空機は過度に作動し、制御エフェクタ間で制御コマンドを分配するために制御割り当てスキームが必要となる。
伝統的に最適化に基づく制御割当スキームが用いられるが、非線型割当問題では、これらの手法は大きな計算資源を必要とする。
本研究では,ニューラルネットワーク(ANN)に基づく非線形制御割り当て方式を提案する。
論文 参考訳(メタデータ) (2022-01-17T02:30:25Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - HydroPower Plant Planning for Resilience Improvement of Power Systems
using Fuzzy-Neural based Genetic Algorithm [0.0]
本稿では,負荷周波数制御(LFC)に基づく小規模水力発電所の最適化手法を提案する。
本手法では,自己調整型ファジィ比導関数(PD)法を用いて予測・予測を行う。
ディープスパイキングニューラルネットワーク(SNN)は、この負荷周波数制御を最適化するために、主にディープラーニング技術として使用されるもので、ディープスパイキングニューラルネットワーク(DSNN)となる。
論文 参考訳(メタデータ) (2021-06-16T21:08:01Z) - Online Algorithms and Policies Using Adaptive and Machine Learning
Approaches [0.22020053359163297]
非線形力学系の2つのクラスが考慮され、どちらも制御アフィンである。
本稿では,外ループにおける強化学習に基づくポリシーの組み合わせを,名目力学の安定性と最適性を確保するために好適に選択する。
リアルタイム制御による安定性保証の確立に加えて、AC-RLコントローラは、持続的な励振を伴うパラメータ学習につながることも示している。
論文 参考訳(メタデータ) (2021-05-13T22:51:25Z) - Stable Online Control of Linear Time-Varying Systems [49.41696101740271]
COCO-LQは、大規模なLTVシステムの入出力安定性を保証する効率的なオンライン制御アルゴリズムである。
COCO-LQの性能を実証実験とパワーシステム周波数制御の両例で実証した。
論文 参考訳(メタデータ) (2021-04-29T06:18:49Z) - Two-step reinforcement learning for model-free redesign of nonlinear
optimal regulator [1.5624421399300306]
強化学習(Reinforcement Learning, RL)は、非線形力学系のための最適制御系をモデル無しで再設計できる、有望なアプローチの1つである。
未知の非線形システムに対する最適レギュレーション再設計問題において,RLの過渡学習性能を向上させるモデルフリー2段階設計手法を提案する。
論文 参考訳(メタデータ) (2021-03-05T17:12:33Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。