論文の概要: A New Error Temporal Difference Algorithm for Deep Reinforcement Learning in Microgrid Optimization
- arxiv url: http://arxiv.org/abs/2511.18093v1
- Date: Sat, 22 Nov 2025 15:29:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.626369
- Title: A New Error Temporal Difference Algorithm for Deep Reinforcement Learning in Microgrid Optimization
- Title(参考訳): マイクログリッド最適化における深部強化学習のための新しい誤り時間差アルゴリズム
- Authors: Fulong Yao, Wanqing Zhao, Matthew Forshaw,
- Abstract要約: 本稿では,予測の不確実性に対処する新しい誤り時間差(ETD)アルゴリズムを提案する。
再生可能エネルギー源(RES)とエネルギー貯蔵システム(ESS)を統合したマイクログリッドシステムをモデル化する。
次に、重み付き平均アルゴリズムと新しいETDアルゴリズムを設計し、予測の不確かさを定量化し対処するディープQネットワーク(DQN)に基づく予測制御手法を提案する。
- 参考スコア(独自算出の注目度): 5.605678552776343
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predictive control approaches based on deep reinforcement learning (DRL) have gained significant attention in microgrid energy optimization. However, existing research often overlooks the issue of uncertainty stemming from imperfect prediction models, which can lead to suboptimal control strategies. This paper presents a new error temporal difference (ETD) algorithm for DRL to address the uncertainty in predictions,aiming to improve the performance of microgrid operations. First,a microgrid system integrated with renewable energy sources (RES) and energy storage systems (ESS), along with its Markov decision process (MDP), is modelled. Second, a predictive control approach based on a deep Q network (DQN) is presented, in which a weighted average algorithm and a new ETD algorithm are designed to quantify and address the prediction uncertainty, respectively. Finally, simulations on a realworld US dataset suggest that the developed ETD effectively improves the performance of DRL in optimizing microgrid operations.
- Abstract(参考訳): 深部強化学習(DRL)に基づく予測制御アプローチは、マイクログリッドエネルギー最適化において大きな注目を集めている。
しかし、既存の研究では、不完全な予測モデルに起因する不確実性の問題がしばしば見過ごされるため、最適下制御戦略につながる可能性がある。
本稿では,予測の不確実性に対処する新しいエラー時間差(ETD)アルゴリズムを提案する。
まず、再生可能エネルギー源(RES)とエネルギー貯蔵システム(ESS)を統合したマイクログリッドシステムと、マルコフ決定プロセス(MDP)をモデル化する。
次に、重み付き平均アルゴリズムと新しいETDアルゴリズムをそれぞれ設計し、予測の不確かさを定量化し対処するディープQネットワーク(DQN)に基づく予測制御手法を提案する。
最後に、実世界の米国データセット上でのシミュレーションにより、開発したETDは、マイクログリッド操作の最適化において、DRLの性能を効果的に向上することを示唆している。
関連論文リスト
- Approximate Model Predictive Control for Microgrid Energy Management via Imitation Learning [9.044455355747482]
本稿では,マイクログリッドエネルギー管理のための混合整数型経済モデル予測制御(EMPC)の模倣学習に基づくフレームワークを提案する。
提案手法は、ニューラルネットワークを用いて、オフライン軌道からのエキスパートEMPC制御動作を模倣し、最適化問題をオンラインで解決することなく、高速でリアルタイムな意思決定を可能にする。
論文 参考訳(メタデータ) (2025-10-22T21:39:18Z) - RL-finetuning LLMs from on- and off-policy data with a single algorithm [53.70731390624718]
大規模言語モデルを微調整するための新しい強化学習アルゴリズム(AGRO)を提案する。
AGROは生成整合性の概念を利用しており、最適ポリシーはモデルの任意の世代間での整合性の概念を満たすと述べている。
サンプルベースの政策勾配による最適解を求めるアルゴリズムを導出し,その収束に関する理論的保証を提供する。
論文 参考訳(メタデータ) (2025-03-25T12:52:38Z) - Enhancing Microgrid Performance Prediction with Attention-based Deep Learning Models [0.0]
本研究の目的は、グリッド不安定性に寄与する電力振動を特徴とするマイクログリッドシステムの運用上の課題に対処することである。
畳み込みとGRU(Gated Recurrent Unit)の強みを活かした統合戦略が提案されている。
このフレームワークは、包括的な負荷予測を行うMulti-Layer Perceptron(MLP)モデルによって固定されている。
論文 参考訳(メタデータ) (2024-07-20T21:24:11Z) - Active RIS-aided EH-NOMA Networks: A Deep Reinforcement Learning
Approach [66.53364438507208]
アクティブな再構成可能なインテリジェントサーフェス(RIS)支援マルチユーザダウンリンク通信システムについて検討した。
非直交多重アクセス(NOMA)はスペクトル効率を向上させるために使用され、活性RISはエネルギー回収(EH)によって駆動される。
ユーザの動的通信状態を予測するために,高度なLSTMベースのアルゴリズムを開発した。
増幅行列と位相シフト行列RISを結合制御するためにDDPGに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-11T13:16:28Z) - UAV Path Planning Employing MPC- Reinforcement Learning Method for
search and rescue mission [0.0]
複雑で不確実な環境での無人航空路計画(UA V)の課題に取り組む。
本稿では,Long-Short-Term Memory (LSTM) ネットワークに基づくモデル予測制御(MPC)を,Deep Deterministic Policy Gradientアルゴリズムに統合して設計する。
論文 参考訳(メタデータ) (2023-02-21T13:39:40Z) - Coverage and Capacity Optimization in STAR-RISs Assisted Networks: A
Machine Learning Approach [102.00221938474344]
再構成可能なインテリジェントサーフェス (STAR-RIS) アシストネットワークを同時に送信および反射するカバレッジとキャパシティ最適化のための新しいモデルを提案する。
損失関数ベースの更新戦略はコアポイントであり、各更新時にmin-normソルバによってカバレッジとキャパシティの両方の損失関数の重みを計算することができる。
解析結果から,提案手法は固定重みに基づくMOアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-04-13T13:52:22Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Reconfigurable Intelligent Surface Assisted Multiuser MISO Systems
Exploiting Deep Reinforcement Learning [21.770491711632832]
再構成可能なインテリジェントサーフェス(RIS)は、将来の6世代(6G)無線通信システムにおいて重要な技術の一つとして推測されている。
本稿では, 基地局におけるビームフォーミング行列とRISにおける位相シフト行列の接合設計について, 深部強化学習(DRL)の最近の進歩を活用して検討する。
提案アルゴリズムは環境から学習し、その振る舞いを徐々に改善するだけでなく、2つの最先端ベンチマークと比較して同等の性能が得られる。
論文 参考訳(メタデータ) (2020-02-24T04:28:44Z) - RIS Enhanced Massive Non-orthogonal Multiple Access Networks: Deployment
and Passive Beamforming Design [116.88396201197533]
再構成可能なインテリジェントサーフェス(RIS)の配置と受動ビームフォーミング設計のための新しいフレームワークを提案する。
エネルギー効率を最大化するために、共同配置、位相シフト設計、および電力配分の問題を定式化する。
リアルタイムデータセットを活用することで,ユーザの遠隔交通需要を予測するために,LSTM(Long Short-term memory)ベースのエコー状態ネットワーク(ESN)アルゴリズムを提案する。
RISの展開と設計の連立問題を解くために,D3QNに基づく位置取得と位相制御アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-28T14:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。