論文の概要: Deep Reinforcement Learning for Power Grid Multi-Stage Cascading Failure Mitigation
- arxiv url: http://arxiv.org/abs/2505.09012v1
- Date: Tue, 13 May 2025 23:01:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.318475
- Title: Deep Reinforcement Learning for Power Grid Multi-Stage Cascading Failure Mitigation
- Title(参考訳): 電力グリッド多段カスケード故障軽減のための深部強化学習
- Authors: Bo Meng, Chenghao Xu, Yongli Zhu,
- Abstract要約: 電力網のカスケード故障は、社会活動や経済活動に深刻な混乱をもたらす可能性がある。
既存のカスケード障害軽減戦略は、通常、単一ステージベースであり、多ステージシナリオの複雑さを見下ろしている。
本稿では,多段階カスケード故障問題を強化学習課題として扱い,シミュレーション環境を開発する。
- 参考スコア(独自算出の注目度): 1.8775413720750922
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cascading failures in power grids can lead to grid collapse, causing severe disruptions to social operations and economic activities. In certain cases, multi-stage cascading failures can occur. However, existing cascading-failure-mitigation strategies are usually single-stage-based, overlooking the complexity of the multi-stage scenario. This paper treats the multi-stage cascading failure problem as a reinforcement learning task and develops a simulation environment. The reinforcement learning agent is then trained via the deterministic policy gradient algorithm to achieve continuous actions. Finally, the effectiveness of the proposed approach is validated on the IEEE 14-bus and IEEE 118-bus systems.
- Abstract(参考訳): 電力グリッドのカスケード障害はグリッド崩壊を招き、社会活動や経済活動に深刻な混乱をもたらす可能性がある。
場合によっては、多段階カスケード障害が発生することがある。
しかし、既存のカスケード障害軽減戦略は、通常、多段階シナリオの複雑さを見越して、単一ステージベースである。
本稿では,多段階カスケード故障問題を強化学習課題として扱い,シミュレーション環境を開発する。
強化学習エージェントは、決定論的ポリシー勾配アルゴリズムを介して訓練され、連続的な動作が達成される。
最後に,提案手法の有効性をIEEE 14-busとIEEE 118-busシステムで検証した。
関連論文リスト
- On Sequential Fault-Intolerant Process Planning [60.66853798340345]
我々は、逐次的フォールトトレラントプロセス計画(SFIPP)と呼ばれる計画問題を提案し、研究する。
SFIPPは、全ての段階が成功する場合にのみ計画が成功すると判断される多くの連続した多段階決定問題に共通する報酬構造をキャプチャする。
私たちは、異なるアクションを選択して、それぞれのステージで成功の確率を未知にする必要がある設定のために、確実に厳密なオンラインアルゴリズムを設計します。
論文 参考訳(メタデータ) (2025-02-07T15:20:35Z) - HiMAP: Learning Heuristics-Informed Policies for Large-Scale Multi-Agent
Pathfinding [16.36594480478895]
Heuristics-Informed Multi-Agent Pathfinding (HiMAP)
Heuristics-Informed Multi-Agent Pathfinding (HiMAP)
論文 参考訳(メタデータ) (2024-02-23T13:01:13Z) - Robust Stochastically-Descending Unrolled Networks [85.6993263983062]
Deep Unrolling(ディープ・アンローリング)は、トレーニング可能なニューラルネットワークの層に切り捨てられた反復アルゴリズムをアンロールする、新たな学習最適化手法である。
アンロールネットワークの収束保証と一般化性は、いまだにオープンな理論上の問題であることを示す。
提案した制約の下で訓練されたアンロールアーキテクチャを2つの異なるアプリケーションで数値的に評価する。
論文 参考訳(メタデータ) (2023-12-25T18:51:23Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Power Grid Cascading Failure Mitigation by Reinforcement Learning [0.0]
本稿では,強化学習(RL)に基づくカスケード障害軽減戦略を提案する。
マルチステージカスケード故障問題のボトムレベル補正制御はDCOPFに基づいて定式化される。
提案手法によるIEEE 118バスシステム実験は,システム崩壊の低減に有望な性能を示す。
論文 参考訳(メタデータ) (2021-08-23T21:41:44Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Safe Reinforcement Learning of Control-Affine Systems with Vertex
Networks [14.461847761198037]
本稿では,厳密な状態と行動制約を持つ制御系に対する強化学習ポリシーの探索に焦点をあてる。
制約満足度、あるいは安全性を確保するためのこれまでの作業は、学習されたポリシーに予測ステップを追加することに重点を置いていた。
この問題に対処するため,本研究では,探索中の安全性と学習制御ポリシを保証したVertex Networks (VNs) と呼ばれる新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-03-20T20:32:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。