論文の概要: A Hierarchical Deep Actor-Critic Learning Method for Joint Distribution
System State Estimation
- arxiv url: http://arxiv.org/abs/2012.02880v1
- Date: Fri, 4 Dec 2020 22:38:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-22 22:36:43.458277
- Title: A Hierarchical Deep Actor-Critic Learning Method for Joint Distribution
System State Estimation
- Title(参考訳): 共同配電系統状態推定のための階層的深部アクター・クリティカル学習法
- Authors: Yuxuan Yuan, Kaveh Dehghanpour, Zhaoyu Wang, Fankun Bu
- Abstract要約: グリッドエッジにおける顧客のリアルタイム監視は、重要なタスクとなっている。
ほぼリアルタイムなソリューションを実現するために,新しい階層型強化学習支援フレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.7205106391379026
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to increasing penetration of volatile distributed photovoltaic (PV)
resources, real-time monitoring of customers at the grid-edge has become a
critical task. However, this requires solving the distribution system state
estimation (DSSE) jointly for both primary and secondary levels of distribution
grids, which is computationally complex and lacks scalability to large systems.
To achieve near real-time solutions for DSSE, we present a novel hierarchical
reinforcement learning-aided framework: at the first layer, a weighted least
squares (WLS) algorithm solves the DSSE over primary medium-voltage feeders; at
the second layer, deep actor-critic (A-C) modules are trained for each
secondary transformer using measurement residuals to estimate the states of
low-voltage circuits and capture the impact of PVs at the grid-edge. While the
A-C parameter learning process takes place offline, the trained A-C modules are
deployed online for fast secondary grid state estimation; this is the key
factor in scalability and computational efficiency of the framework. To
maintain monitoring accuracy, the two levels exchange boundary information with
each other at the secondary nodes, including transformer voltages (first layer
to second layer) and active/reactive total power injection (second layer to
first layer). This interactive information passing strategy results in a
closed-loop structure that is able to track optimal solutions at both layers in
few iterations. Moreover, our model can handle the topology changes using the
Jacobian matrices of the first layer. We have performed numerical experiments
using real utility data and feeder models to verify the performance of the
proposed framework.
- Abstract(参考訳): 揮発性分散型太陽光発電(PV)リソースの普及により,グリッドエッジにおける顧客のリアルタイムモニタリングが重要な課題となっている。
しかし、計算が複雑で大規模システムへの拡張性に欠ける分散グリッドの一次レベルと二次レベルの両方について、dsse(distribution system state estimation)を共同で解決する必要がある。
DSSEのほぼリアルタイムな解を実現するため,第1層では重み付き最小二乗法(WLS)アルゴリズムが一次中電圧供給装置よりもDSSEを解くとともに,第2層では,低電圧回路の状態を推定し,グリッドエッジにおけるPVの影響を捉えるために,各二次変圧器に対してディープアクタクリティカル(A-C)モジュールを訓練する。
A-Cパラメータ学習プロセスはオフラインで行われるが、トレーニングされたA-Cモジュールは高速な二次グリッド状態推定のためにオンラインでデプロイされる。
監視精度を維持するために、2つのレベルは、トランス電圧(第1層から第2層)とアクティブ/反応性全電力注入(第2層から第1層)を含む二次ノードで境界情報を交換する。
このインタラクティブな情報伝達戦略は、数回のイテレーションで両方の層で最適な解を追跡できるクローズドループ構造をもたらす。
さらに,本モデルは第1層のヤコビ行列を用いてトポロジの変化を処理できる。
提案手法の性能を検証するために,実効用データとフィードモデルを用いて数値実験を行った。
関連論文リスト
- RLEEGNet: Integrating Brain-Computer Interfaces with Adaptive AI for
Intuitive Responsiveness and High-Accuracy Motor Imagery Classification [0.0]
本稿では,Deep Q-Networks (DQN) を用いた強化学習を分類タスクに活用するフレームワークを提案する。
本稿では,OVR(One-Versus-The-Rest)方式で,マルチクラス運動画像(MI)分類のための前処理手法を提案する。
DQNと1D-CNN-LSTMアーキテクチャの統合は意思決定プロセスをリアルタイムで最適化する。
論文 参考訳(メタデータ) (2024-02-09T02:03:13Z) - Unsupervised Deep Unfolded PGD for Transmit Power Allocation in Wireless
Systems [0.6091702876917281]
本稿では,反復射影勾配(PGD)アルゴリズムをニューラルネットワークの層に深く展開し,ステップサイズパラメータを学習する,単純な低複素性TPCアルゴリズムを提案する。
高密度デバイス間通信(D2D)における性能評価の結果,提案手法は2回以上の繰り返し回数で反復アルゴリズムよりも優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-06-20T19:51:21Z) - ConvBLS: An Effective and Efficient Incremental Convolutional Broad
Learning System for Image Classification [63.49762079000726]
球状K-means(SKM)アルゴリズムと2段階マルチスケール(TSMS)機能融合に基づく畳み込み広範学習システム(ConvBLS)を提案する。
提案手法は前代未聞の効率的かつ効果的である。
論文 参考訳(メタデータ) (2023-04-01T04:16:12Z) - An Adaptive and Stability-Promoting Layerwise Training Approach for Sparse Deep Neural Network Architecture [0.0]
この研究は、与えられたトレーニングデータセットに対してうまく一般化するディープニューラルネットワーク(DNN)アーキテクチャを開発するための2段階適応フレームワークを提案する。
第1段階では、新しいレイヤを毎回追加し、前のレイヤでパラメータを凍結することで独立してトレーニングする、レイヤワイズトレーニングアプローチが採用されている。
本稿では, 学習アルゴリズムの望ましい特性として, エプシロン・デルタ安定促進の概念を導入し, 多様体正規化を用いることで, エプシロン・デルタ安定促進アルゴリズムが得られることを示す。
論文 参考訳(メタデータ) (2022-11-13T09:51:16Z) - Embed to Control Partially Observed Systems: Representation Learning with Provable Sample Efficiency [105.17746223041954]
部分的に観察されたマルコフ決定過程(POMDP)における強化学習は2つの課題に直面している。
しばしば、未来を予測するのに完全な歴史を要し、地平線と指数関数的にスケールするサンプルの複雑さを誘導する。
本稿では,2段階の表現を最適化しながら学習するETC(Embed to Control)という強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-26T16:34:46Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Layer Pruning on Demand with Intermediate CTC [50.509073206630994]
我々はコネクショニスト時間分類(CTC)に基づくASRの訓練と刈り取り方法を提案する。
本稿では,Transformer-CTCモデルをオンデマンドで様々な深さでプルーニングできることを示し,GPU上でのリアルタイム係数を0.005から0.002に改善した。
論文 参考訳(メタデータ) (2021-06-17T02:40:18Z) - Unsupervised learning of disentangled representations in deep restricted
kernel machines with orthogonality constraints [15.296955630621566]
Constr-DRKMは、非教師なしデータ表現の学習のためのディープカーネル手法である。
本研究では,不整合特徴学習における提案手法の有効性を定量的に評価する。
論文 参考訳(メタデータ) (2020-11-25T11:40:10Z) - Dual-constrained Deep Semi-Supervised Coupled Factorization Network with
Enriched Prior [80.5637175255349]
本稿では、DS2CF-Netと呼ばれる、拡張された事前制約付きDual-Constrained Deep Semi-Supervised Coupled Factorization Networkを提案する。
隠れた深い特徴を抽出するために、DS2CF-Netは、深い構造と幾何学的な構造に制約のあるニューラルネットワークとしてモデル化される。
我々のネットワークは、表現学習とクラスタリングのための最先端の性能を得ることができる。
論文 参考訳(メタデータ) (2020-09-08T13:10:21Z) - Single-step deep reinforcement learning for open-loop control of laminar
and turbulent flows [0.0]
本研究は,流体力学系の最適化と制御を支援するための深部強化学習(DRL)技術の能力を評価する。
原型ポリシー最適化(PPO)アルゴリズムの新たな"退化"バージョンを組み合わせることで、学習エピソード当たり1回だけシステムを最適化するニューラルネットワークをトレーニングする。
論文 参考訳(メタデータ) (2020-06-04T16:11:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。