論文の概要: Communication-aware Wide-Area Damping Control using Risk-Constrained Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2509.23620v1
- Date: Sun, 28 Sep 2025 03:51:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.333385
- Title: Communication-aware Wide-Area Damping Control using Risk-Constrained Reinforcement Learning
- Title(参考訳): リスク制約付き強化学習を用いた広域制振制御
- Authors: Kyung-bin Kwon, Lintao Ye, Vijay Gupta, Hao Zhu,
- Abstract要約: 非理想的な通信リンク、特に遅延は、電力系統の高速ネットワーク制御に重大な影響を及ぼす。
伝統的に、このサイバー物理結合に対処するために遅延推定と補償アプローチが採用されている。
本稿では,通信遅延をターゲットとしたリスク制約付きフレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.743206380715843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Non-ideal communication links, especially delays, critically affect fast networked controls in power systems, such as the wide-area damping control (WADC). Traditionally, a delay estimation and compensation approach is adopted to address this cyber-physical coupling, but it demands very high accuracy for the fast WADC and cannot handle other cyber concerns like link failures or {cyber perturbations}. Hence, we propose a new risk-constrained framework that can target the communication delays, yet amenable to general uncertainty under the cyber-physical couplings. Our WADC model includes the synchronous generators (SGs), and also voltage source converters (VSCs) for additional damping capabilities. To mitigate uncertainty, a mean-variance risk constraint is introduced to the classical optimal control cost of the linear quadratic regulator (LQR). Unlike estimating delays, our approach can effectively mitigate large communication delays by improving the worst-case performance. A reinforcement learning (RL)-based algorithm, namely, stochastic gradient-descent with max-oracle (SGDmax), is developed to solve the risk-constrained problem. We further show its guaranteed convergence to stationarity at a high probability, even using the simple zero-order policy gradient (ZOPG). Numerical tests on the IEEE 68-bus system not only verify SGDmax's convergence and VSCs' damping capabilities, but also demonstrate that our approach outperforms conventional delay compensator-based methods under estimation error. While focusing on performance improvement under large delays, our proposed risk-constrained design can effectively mitigate the worst-case oscillations, making it equally effective for addressing other communication issues and cyber perturbations.
- Abstract(参考訳): 非理想的な通信リンク、特に遅延は、広域減衰制御(WADC)のような電力系統の高速ネットワーク制御に重大な影響を及ぼす。
伝統的に、このサイバー物理的結合に対処するために遅延推定と補償のアプローチが採用されているが、高速WADCに対して非常に高い精度を必要とするため、リンク障害やサイバー摂動のような他のサイバー問題には対処できない。
そこで本稿では,サイバー物理結合下での一般的な不確実性に対処可能な,通信遅延をターゲットとした新たなリスク制約フレームワークを提案する。
我々のWADCモデルは、同期発電機(SG)と、追加減衰機能のための電圧源コンバータ(VSC)を含む。
不確実性を軽減するため、線形二次規制器(LQR)の古典的最適制御コストに平均分散リスク制約を導入する。
推定遅延と異なり,本手法は,最悪の性能を向上させることにより,通信遅延を効果的に軽減することができる。
リスク制約のある問題を解くために、強化学習(RL)に基づくアルゴリズム、すなわち、マックス・オラクル(SGDmax)を用いた確率勾配退化アルゴリズムを開発した。
さらに、ZOPG(英語版)を用いた場合であっても、その安定度への確実な収束を高い確率で示す。
IEEE 68バスシステムの数値実験は,SGDmaxの収束とVSCの減衰能力を検証するだけでなく,提案手法が従来の遅延補償器方式よりも優れていることを示す。
大きな遅延下での性能改善に重点を置いている間、提案したリスク制約設計は最悪のケースの振動を効果的に軽減し、他の通信問題やサイバー摂動に対処するのに等しく有効である。
関連論文リスト
- Joint Channel Estimation and Computation Offloading in Fluid Antenna-assisted MEC Networks [81.36647816787713]
チャネル推定の遅延を最小限に抑えるためのFA支援オフロードフレームワークを提案する。
提案方式は,効率的な通信を行う場合の精度を大幅に低下させることを示す。
論文 参考訳(メタデータ) (2025-09-16T08:48:44Z) - Backscatter Device-aided Integrated Sensing and Communication: A Pareto Optimization Framework [59.30060797118097]
統合センシング・通信(ISAC)システムは、密集した都市非視線シナリオにおいて大きな性能劣化に遭遇する可能性がある。
本稿では,自然環境に分散した受動的BDを利用した後方散乱近似(BD)支援ISACシステムを提案する。
論文 参考訳(メタデータ) (2025-07-12T17:11:06Z) - A Hybrid Reinforcement Learning Framework for Hard Latency Constrained Resource Scheduling [7.586600116278698]
ハードレイテンシ制約付きリソーススケジューリングのための新しい強化学習フレームワーク(HRL-RSHLC)を提案する。
HRL-RSHLCは,ベースラインアルゴリズムと比較して収束速度が速く,優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2025-03-30T09:39:13Z) - Communication-Efficient Federated Learning by Quantized Variance Reduction for Heterogeneous Wireless Edge Networks [55.467288506826755]
フェデレーテッド・ラーニング(FL)は、無線エッジネットワークにおけるローカル・プライバシ・アウェア・コラボレーティブ・モデルトレーニングの有効なソリューションとして認識されている。
既存の通信効率の高いFLアルゴリズムは、デバイス間の大きなばらつきを低減できない。
本稿では,高度分散還元方式に依存する新しい通信効率FLアルゴリズムであるFedQVRを提案する。
論文 参考訳(メタデータ) (2025-01-20T04:26:21Z) - Latency Optimization in LEO Satellite Communications with Hybrid Beam Pattern and Interference Control [20.19239663262141]
低軌道(LEO)衛星通信システムは次世代用途に不可欠な高容量で低遅延のサービスを提供する。
LEO星座の密な構成は資源配分最適化と干渉管理の課題を提起する。
本稿では,マルチビームLEOシステムにおけるビームスケジューリングとリソース割り当てを最適化するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-14T17:18:24Z) - Conformal Distributed Remote Inference in Sensor Networks Under Reliability and Communication Constraints [61.62410595953275]
通信制約付き分散共形リスク制御(CD-CRC)
CD-CRCは通信制約下でのセンサネットワークのための新しい意思決定フレームワークである。
論文 参考訳(メタデータ) (2024-09-12T10:12:43Z) - Hierarchical Federated Learning in Wireless Networks: Pruning Tackles Bandwidth Scarcity and System Heterogeneity [32.321021292376315]
我々はヘテロジニアスネットワーク(HetNets)におけるプルーニング可能な階層型フェデレーションラーニング(PHFL)を提案する。
まず、モデルプルーニングと無線通信の影響を明確に示す収束率の上限を導出する。
提案するPHFLアルゴリズムの有効性を,テスト精度,壁面時計時間,エネルギー消費,帯域幅要件の観点から検証した。
論文 参考訳(メタデータ) (2023-08-03T07:03:33Z) - Over-the-Air Federated Learning with Privacy Protection via Correlated
Additive Perturbations [57.20885629270732]
我々は、複数のユーザ/エージェントからエッジサーバへの勾配更新をOtA(Over-the-Air)で送信することで、無線フェデレーション学習のプライバシー面を考察する。
従来の摂動に基づく手法は、トレーニングの精度を犠牲にしてプライバシー保護を提供する。
本研究では,エッジサーバにおけるプライバシリークの最小化とモデル精度の低下を目標とする。
論文 参考訳(メタデータ) (2022-10-05T13:13:35Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Delay-Tolerant Constrained OCO with Application to Network Resource
Allocation [44.67787270821051]
マルチスロットフィードバック遅延によるオンライン凸最適化(OCO)を検討します。
エージェントは、時間変動凸損失関数の蓄積を最小限に抑えるために、一連のオンライン決定を行う。
情報フィードバックと意思決定の更新の非同期性に取り組むために,二重正規化による新たな制約ペナルティを用いた遅延耐性制約OCOを提案する。
論文 参考訳(メタデータ) (2021-05-09T19:32:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。