論文の概要: Optimal Scheduling in IoT-Driven Smart Isolated Microgrids Based on Deep
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2305.00127v1
- Date: Fri, 28 Apr 2023 23:52:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 16:59:37.142763
- Title: Optimal Scheduling in IoT-Driven Smart Isolated Microgrids Based on Deep
Reinforcement Learning
- Title(参考訳): 深層強化学習に基づくIoT駆動型スマート分離マイクログリッドの最適スケジューリング
- Authors: Jiaju Qi, Lei Lei, Kan Zheng, Simon X. Yang, Xuemin (Sherman) Shen
- Abstract要約: 深部強化学習(DRL)によるモノ駆動マイクログリッド(MG)におけるディーゼル発電機(DG)のスケジューリング問題について検討する。
DRLエージェントは、過去の履歴再生およびロードデータから最適なポリシーを学習する。
目標は、需給バランスを確保するという前提で運用コストを削減することである。
- 参考スコア(独自算出の注目度): 10.924928763380624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we investigate the scheduling issue of diesel generators (DGs)
in an Internet of Things (IoT)-Driven isolated microgrid (MG) by deep
reinforcement learning (DRL). The renewable energy is fully exploited under the
uncertainty of renewable generation and load demand. The DRL agent learns an
optimal policy from history renewable and load data of previous days, where the
policy can generate real-time decisions based on observations of past renewable
and load data of previous hours collected by connected sensors. The goal is to
reduce operating cost on the premise of ensuring supply-demand balance. In
specific, a novel finite-horizon partial observable Markov decision process
(POMDP) model is conceived considering the spinning reserve. In order to
overcome the challenge of discrete-continuous hybrid action space due to the
binary DG switching decision and continuous energy dispatch (ED) decision, a
DRL algorithm, namely the hybrid action finite-horizon RDPG (HAFH-RDPG), is
proposed. HAFH-RDPG seamlessly integrates two classical DRL algorithms, i.e.,
deep Q-network (DQN) and recurrent deterministic policy gradient (RDPG), based
on a finite-horizon dynamic programming (DP) framework. Extensive experiments
are performed with real-world data in an IoT-driven MG to evaluate the
capability of the proposed algorithm in handling the uncertainty due to
inter-hour and inter-day power fluctuation and to compare its performance with
those of the benchmark algorithms.
- Abstract(参考訳): 本稿では,モノのインターネット(IoT)駆動型孤立マイクログリッド(MG)におけるディーゼル発電機(DG)の深部強化学習(DRL)によるスケジューリング問題について検討する。
再生可能エネルギーは再生可能エネルギーと負荷需要の不確実性の下で完全に活用される。
drlエージェントは、前日の履歴再生可能および負荷データから最適なポリシーを学習し、コネクテッドセンサーによって収集された前時間の過去の再生可能および負荷データの観測に基づいて、リアルタイムな決定を生成できる。
目標は、需給バランスの確保を前提とした運用コストの削減だ。
具体的には、回転準備を考慮した新しい有限水平部分可観測マルコフ決定過程 (POMDP) モデルが考案される。
二元的DG切替決定と連続エネルギー分散(ED)決定による離散連続ハイブリッド行動空間の課題を克服するために、DRLアルゴリズム、すなわちハイブリッドアクション有限水平RDPG(HAFH-RDPG)を提案する。
HAFH-RDPGは、DQN(Deep Q-network)とRDPG(Recurrent Deterministic Policy gradient)という2つの古典DRLアルゴリズムを有限水平動的プログラミング(DP)フレームワークに基づいてシームレスに統合する。
iot駆動mg内の実世界データを用いて、時間間および日内電力変動による不確実性に対処するための提案アルゴリズムの能力を評価し、その性能をベンチマークアルゴリズムと比較する大規模な実験を行う。
関連論文リスト
- Two-Stage ML-Guided Decision Rules for Sequential Decision Making under Uncertainty [55.06411438416805]
SDMU (Sequential Decision Making Under Uncertainty) は、エネルギー、金融、サプライチェーンといった多くの領域において、ユビキタスである。
いくつかのSDMUは、自然にマルチステージ問題(MSP)としてモデル化されているが、結果として得られる最適化は、計算の観点からは明らかに困難である。
本稿では,2段階の一般決定規則(TS-GDR)を導入し,線形関数を超えて政策空間を一般化する手法を提案する。
TS-GDRの有効性は、TS-LDR(Two-Stage Deep Decision Rules)と呼ばれるディープリカレントニューラルネットワークを用いたインスタンス化によって実証される。
論文 参考訳(メタデータ) (2024-05-23T18:19:47Z) - Lyapunov-Driven Deep Reinforcement Learning for Edge Inference Empowered
by Reconfigurable Intelligent Surfaces [30.1512069754603]
本稿では,ワイヤレスエッジにおけるエネルギー効率,低レイテンシ,高精度な推論のための新しいアルゴリズムを提案する。
本稿では,新しいデータを一連のデバイスで連続的に生成・収集し,動的キューシステムを通じて処理するシナリオについて考察する。
論文 参考訳(メタデータ) (2023-05-18T12:46:42Z) - Differentially Private Deep Q-Learning for Pattern Privacy Preservation
in MEC Offloading [76.0572817182483]
攻撃者は、エッジサーバ(ES)のキュー情報とユーザの使用パターンを推測するために、オフロードの決定を盗み取ることができる。
パターンプライバシ(PP)を維持しつつ,レイテンシ,ESのエネルギー消費,タスク削減率を両立させるオフロード戦略を提案する。
そこで我々はDP-DQOアルゴリズムを開発し,PP問題にノイズを注入することでこの問題に対処する。
論文 参考訳(メタデータ) (2023-02-09T12:50:18Z) - Optimal Planning of Hybrid Energy Storage Systems using Curtailed
Renewable Energy through Deep Reinforcement Learning [0.0]
エネルギー貯蔵システム(ESS)を計画するためのポリシーに基づくアルゴリズムを用いた高度な深層強化学習手法を提案する。
定量的性能比較の結果、DRLエージェントはシナリオベース最適化(SO)アルゴリズムよりも優れていた。
その結果、DRLエージェントは人間の専門家が行うように学習し、提案手法の信頼性が示唆された。
論文 参考訳(メタデータ) (2022-12-12T02:24:50Z) - Distributed Energy Management and Demand Response in Smart Grids: A
Multi-Agent Deep Reinforcement Learning Framework [53.97223237572147]
本稿では、自律制御と再生可能エネルギー資源のスマート電力グリッドシステムへの統合のための多エージェント深層強化学習(DRL)フレームワークを提案する。
特に,提案フレームワークは,住宅利用者に対する需要応答 (DR) と分散エネルギー管理 (DEM) を共同で検討している。
論文 参考訳(メタデータ) (2022-11-29T01:18:58Z) - Joint Energy Dispatch and Unit Commitment in Microgrids Based on Deep
Reinforcement Learning [6.708717040312532]
本稿では,統合エネルギー派遣(ED)と単位コミットメント(UC)を分離したマイクログリッドで決定するための最適な政策を学習するために,深部強化学習(DRL)を適用した。
本稿では、2つの古典的DRLアルゴリズムをシームレスに統合するDRLアルゴリズム,すなわちハイブリッドアクション有限水平DDPG(HAFH-DDPG)を提案する。
ディーゼル発電機(DG)選択戦略を提示し、このアルゴリズムの計算複雑性を低減するため、簡易な動作空間をサポートする。
論文 参考訳(メタデータ) (2022-06-03T16:22:03Z) - Deep Reinforcement Learning Based Multidimensional Resource Management
for Energy Harvesting Cognitive NOMA Communications [64.1076645382049]
エネルギー収穫(EH)、認知無線(CR)、非直交多重アクセス(NOMA)の組み合わせはエネルギー効率を向上させるための有望な解決策である。
本稿では,決定論的CR-NOMA IoTシステムにおけるスペクトル,エネルギー,時間資源管理について検討する。
論文 参考訳(メタデータ) (2021-09-17T08:55:48Z) - Optimizing the Long-Term Average Reward for Continuing MDPs: A Technical
Report [117.23323653198297]
ユーザが経験した情報の鮮度と、センサが消費するエネルギーのバランスをとっています。
対応するステータス更新手順を継続的なマルコフ決定プロセス(MDP)としてキャストします。
次元の呪いを回避するため,我々は深層強化学習(DRL)アルゴリズムを設計するための方法論を確立した。
論文 参考訳(メタデータ) (2021-04-13T12:29:55Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - Dynamic Energy Dispatch Based on Deep Reinforcement Learning in
IoT-Driven Smart Isolated Microgrids [8.623472323825556]
マイクログリッド(MG)は、大きなユーティリティグリッドとは独立して動作可能な小型でローカルな電力グリッドである。
本稿では、IoT駆動型スマートアイソレーションMGのための深部強化学習(DRL)に基づくエネルギーディスパッチに焦点を当てる。
2つの新しいDRLアルゴリズムが提案され、完全観測可能な状態情報とともに、かつ、不要なエネルギー供給ポリシーを導出する。
論文 参考訳(メタデータ) (2020-02-07T01:44:18Z) - Stacked Auto Encoder Based Deep Reinforcement Learning for Online
Resource Scheduling in Large-Scale MEC Networks [44.40722828581203]
オンラインリソーススケジューリングフレームワークは、IoT(Internet of Things)の全ユーザに対して、重み付けされたタスクレイテンシの総和を最小化するために提案されている。
以下を含む深層強化学習(DRL)に基づく解法を提案する。
DRLがポリシーネットワークをトレーニングし、最適なオフロードポリシーを見つけるのを支援するために、保存および優先されたエクスペリエンスリプレイ(2p-ER)を導入する。
論文 参考訳(メタデータ) (2020-01-24T23:01:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。