論文の概要: Evaluation of Look-ahead Economic Dispatch Using Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2209.10207v1
- Date: Wed, 21 Sep 2022 09:08:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 17:10:09.395680
- Title: Evaluation of Look-ahead Economic Dispatch Using Reinforcement Learning
- Title(参考訳): 強化学習を用いたルックアヘッド経済分散の評価
- Authors: Zekuan Yu, Guangchun Ruan, Xinyue Wang, Guanglun Zhang, Yiliu He,
Haiwang Zhong
- Abstract要約: 先行型経済派遣方式における強化学習エージェントの性能分析のための評価手法を提案する。
特に,ネットワークシナリオと需要シナリオを生成するシナリオ生成手法を開発した。
いくつかの指標は、経済と安全保障の観点からエージェントのパフォーマンスを評価するために定義される。
- 参考スコア(独自算出の注目度): 4.513295381096656
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Modern power systems are experiencing a variety of challenges driven by
renewable energy, which calls for developing novel dispatch methods such as
reinforcement learning (RL). Evaluation of these methods as well as the RL
agents are largely under explored. In this paper, we propose an evaluation
approach to analyze the performance of RL agents in a look-ahead economic
dispatch scheme. This approach is conducted by scanning multiple operational
scenarios. In particular, a scenario generation method is developed to generate
the network scenarios and demand scenarios for evaluation, and network
structures are aggregated according to the change rates of power flow. Then
several metrics are defined to evaluate the agents' performance from the
perspective of economy and security. In the case study, we use a modified IEEE
30-bus system to illustrate the effectiveness of the proposed evaluation
approach, and the simulation results reveal good and rapid adaptation to
different scenarios. The comparison between different RL agents is also
informative to offer advice for a better design of the learning strategies.
- Abstract(参考訳): 現代の電力システムには再生可能エネルギーによる様々な課題があり、強化学習(RL)のような新しいディスパッチ手法の開発が求められている。
これらの方法とRL剤の評価は, 主に検討中である。
本稿では,先見的経済派遣方式におけるrlエージェントの性能評価手法を提案する。
このアプローチは複数の運用シナリオをスキャンすることで実行される。
特に、評価のためのネットワークシナリオと需要シナリオを生成するシナリオ生成法を開発し、電力フローの変化率に応じてネットワーク構造を集約する。
その後、経済と安全保障の観点からエージェントのパフォーマンスを評価するためにいくつかの指標が定義される。
ケーススタディでは,改良型IEEE 30バスシステムを用いて,提案手法の有効性を実証し,シミュレーション結果から,異なるシナリオへの適応性,迅速な適応性を示した。
異なるRLエージェントの比較も有益であり、学習戦略をより良く設計するためのアドバイスを提供する。
関連論文リスト
- Multi-agent Off-policy Actor-Critic Reinforcement Learning for Partially Observable Environments [30.280532078714455]
本研究では,強化学習のためのマルチエージェント・オフ・ポリティクス・アクター・クリティック・アルゴリズムにおいて,グローバルな状態を推定するソーシャル・ラーニング手法を提案する。
社会的学習法により,世界状態が完全に観察された場合と推定された場合の最終的な結果の差が,社会的学習更新の適切な回数の反復を行う場合に,$varepsilon$-boundedとなることを示す。
論文 参考訳(メタデータ) (2024-07-06T06:51:14Z) - Meta-Gradient Search Control: A Method for Improving the Efficiency of Dyna-style Planning [8.552540426753]
本稿では,Dynaスタイルのプランニング中に状態がクエリされる確率を調整可能な,オンラインのメタグラディエントアルゴリズムを提案する。
その結果,提案手法は計画プロセスの効率化を図っている。
論文 参考訳(メタデータ) (2024-06-27T22:24:46Z) - Towards Evaluating Transfer-based Attacks Systematically, Practically,
and Fairly [79.07074710460012]
ディープニューラルネットワーク(DNN)の敵対的脆弱性に大きな注目を集めている。
ブラックボックスDNNモデルを騙すための転送ベース手法が増えている。
30以上のメソッドを実装した転送ベースアタックベンチマーク(TA-Bench)を確立する。
論文 参考訳(メタデータ) (2023-11-02T15:35:58Z) - A Novel Benchmarking Paradigm and a Scale- and Motion-Aware Model for
Egocentric Pedestrian Trajectory Prediction [7.306417438683524]
我々は,エゴセントリックな歩行者軌道予測アルゴリズムを評価するための新しいパラダイムを提案する。
我々は,挑戦的なシナリオにおいて,我々のアプローチが最大40%の大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2023-10-16T14:08:34Z) - Diffusion-based Visual Counterfactual Explanations -- Towards Systematic
Quantitative Evaluation [64.0476282000118]
視覚的対物的説明法(VCE)の最新手法は、深い生成モデルの力を利用して、印象的な画質の高次元画像の新しい例を合成する。
評価手順が大きく異なり,個々の実例の視覚検査や小規模なユーザスタディなど,これらのVCE手法の性能を比較することは,現時点では困難である。
本稿では,VCE手法の体系的,定量的評価のためのフレームワークと,使用する指標の最小セットを提案する。
論文 参考訳(メタデータ) (2023-08-11T12:22:37Z) - REX: Rapid Exploration and eXploitation for AI Agents [103.68453326880456]
本稿では、REXと呼ばれるAIエージェントのための高速探索およびeXploitationのための改良されたアプローチを提案する。
REXは追加の報酬層を導入し、アッパー信頼境界(UCB)スコアに似た概念を統合し、より堅牢で効率的なAIエージェントのパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-07-18T04:26:33Z) - Better Understanding Differences in Attribution Methods via Systematic Evaluations [57.35035463793008]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
これらの評価手法を用いて、広範囲のモデルにおいて広く用いられている属性手法の長所と短所について検討する。
論文 参考訳(メタデータ) (2023-03-21T14:24:58Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Backward Imitation and Forward Reinforcement Learning via Bi-directional
Model Rollouts [11.4219428942199]
従来のモデルベース強化学習(RL)手法は、学習力学モデルを用いて前方ロールアウトトレースを生成する。
本稿では,後方模倣とフォワード強化学習(BIFRL)フレームワークを提案する。
BIFRLは、より効率的な方法で高価値状態に到達し、探索するエージェントに権限を与える。
論文 参考訳(メタデータ) (2022-08-04T04:04:05Z) - Towards Better Understanding Attribution Methods [77.1487219861185]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
また,いくつかの属性法の性能を著しく向上する処理後平滑化ステップを提案する。
論文 参考訳(メタデータ) (2022-05-20T20:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。