論文の概要: Neural Network-Assisted Model Predictive Control for Implicit Balancing
- arxiv url: http://arxiv.org/abs/2604.01805v1
- Date: Thu, 02 Apr 2026 09:16:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.631886
- Title: Neural Network-Assisted Model Predictive Control for Implicit Balancing
- Title(参考訳): ニューラルネットワークを用いたインシデントバランシングのためのモデル予測制御
- Authors: Seyed Soroush Karimi Madahi, Kenneth Bruninx, Bert Claessens, Chris Develder,
- Abstract要約: ヨーロッパでは、責任ある当事者は、配電系統の安定性を維持し利益を上げるために、配電系統のオペレーター(TSO)を支援するために、意図的にバランスの取れない立場を取ることができる。
モデル予測制御(MPC)は暗黙的バランスの効果的なアプローチとして広く採用されている。
これまでの研究では、(i)凸市場クリア化近似、TSOの積極的な手動行動、および市場準四半期のダイナミックスを無視して、この市場をモデル化した。
本稿では,不確実性を捕捉しながら凸性を確保するために,入力凸ニューラルネットワークを用いてMPCに統合されたデータ駆動型市場モデルを提案する。
- 参考スコア(独自算出の注目度): 2.6288470934623636
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In Europe, balance responsible parties can deliberately take out-of-balance positions to support transmission system operators (TSOs) in maintaining grid stability and earn profit, a practice called implicit balancing. Model predictive control (MPC) is widely adopted as an effective approach for implicit balancing. The balancing market model accuracy in MPC is critical to decision quality. Previous studies modeled this market using either (i) a convex market clearing approximation, ignoring proactive manual actions by TSOs and the market sub-quarter-hour dynamics, or (ii) machine learning methods, which cannot be directly integrated into MPC. To address these shortcomings, we propose a data-driven balancing market model integrated into MPC using an input convex neural network to ensure convexity while capturing uncertainties. To keep the core network computationally efficient, we incorporate attention-based input gating mechanisms to remove irrelevant data. Evaluating on Belgian data shows that the proposed model both improves MPC decisions and reduces computational time.
- Abstract(参考訳): ヨーロッパでは、責任ある当事者は、グリッド安定性の維持と利益の獲得においてトランスミッション・システム・オペレーター(TSO)を支援するために、故意にバランスの取れない立場を取ることができる。
モデル予測制御(MPC)は暗黙的バランスの効果的なアプローチとして広く採用されている。
MPCにおける市場モデルのバランスの正確さは、意思決定の品質に不可欠である。
この市場をモデル化した先行研究
一 凸市場浄化の近似であって、TSO及び市場準経時変動による積極的手動行為を無視すること。
(II)MPCに直接統合できない機械学習手法。
これらの欠点に対処するために、入力凸ニューラルネットワークを用いてMPCに統合されたデータ駆動型均衡市場モデルを提案し、不確実性を捕捉しながら凸性を確保する。
コアネットワークを計算効率よく維持するために、注意に基づく入力ゲーティング機構を導入し、無関係なデータを除去する。
ベルギーのデータから,提案モデルがMPC決定を改善し,計算時間を短縮することを示す。
関連論文リスト
- Calibrated uncertainty quantification for prosumer flexibility aggregation in ancillary service markets [0.9612977347324178]
本稿では,モンテカルロ・ドロップアウト(MCD)と共形予測(CP)を統合したスケーラブルな不確実性フレームワークを提案する。
大規模な合成データセットは、業界グレードの家庭用エネルギー管理システムを使用して生成され、公的に利用可能な負荷、太陽、価格、アクティベーション、デバイスレベルのデータと組み合わせられる。
その結果,スタンドアローンのMCDは可利用な柔軟性を過大評価し,P90準拠に反するが,提案したMCD-CPフレームワークは制御された保守性で信頼性の高いカバレッジを達成できることがわかった。
論文 参考訳(メタデータ) (2026-01-21T05:21:31Z) - Fine-Tuning of Neural Network Approximate MPC without Retraining via Bayesian Optimization [81.35990332700389]
近似モデル予測制御(AMPC)は、MPCの動作をニューラルネットワークで模倣することを目的としている。
デプロイメント中、基盤となるMPCのパラメータは通常、微調整されなければならない。
最近の研究は、MPC最適化問題の近似感度を用いてAMPCを調整することなく適用することでこの問題に対処している。
論文 参考訳(メタデータ) (2025-12-16T12:24:08Z) - BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping [69.74252624161652]
適応クリッピング(BAPO)を用いたBAlanced Policy Optimizationを提案する。
BAPOはクリッピングバウンダリを動的に調整し、適応的に正と負のコントリビューションを再バランスさせ、エントロピーを保持し、RL最適化を安定化させる。
AIME 2024とAIME 2025ベンチマークでは、7B BAPOモデルがSkyWork-OR1-7Bのようなオープンソースモデルを上回っています。
論文 参考訳(メタデータ) (2025-10-21T12:55:04Z) - Model Predictive Control-Guided Reinforcement Learning for Implicit Balancing [2.6288470934623636]
ヨーロッパでは、利益を追求する責任ある当事者は、日々の指名からリアルタイムで逸脱し、送信システムオペレーターを支援することができる。
本稿では, MPC と RL の相補的強度を組み合わせた MPC 誘導 RL 法を提案する。
2023年のベルギーのバランシングデータを用いて,暗黙的バランシングバッテリ制御問題に対して,提案手法の性能評価を行った。
論文 参考訳(メタデータ) (2025-10-06T14:52:27Z) - MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [92.40586697273868]
モノのインターネットのタイムリーな更新は、車載メタバースサービスの没入を実現するために不可欠である。
本稿では,フェデレーション学習による効率的なプライバシ保護データ提供を可能にする没入型モデルトレーディングフレームワークを提案する。
実験の結果,提案手法は最先端のベンチマークよりも優れていた。
論文 参考訳(メタデータ) (2024-10-25T16:20:46Z) - End-to-End Reinforcement Learning of Koopman Models for Economic Nonlinear Model Predictive Control [45.84205238554709]
本研究では, (e)NMPCの一部として最適性能を示すために, Koopman シュロゲートモデルの強化学習法を提案する。
エンドツーエンドトレーニングモデルは,(e)NMPCにおけるシステム識別を用いてトレーニングしたモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-03T10:21:53Z) - Stochastic Methods for AUC Optimization subject to AUC-based Fairness
Constraints [51.12047280149546]
公正な予測モデルを得るための直接的なアプローチは、公正な制約の下で予測性能を最適化することでモデルを訓練することである。
フェアネスを考慮した機械学習モデルのトレーニング問題を,AUCに基づくフェアネス制約のクラスを対象とする最適化問題として定式化する。
フェアネス測定値の異なる実世界のデータに対するアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-12-23T22:29:08Z) - Deep Reinforcement Learning Approach for Trading Automation in The Stock
Market [0.0]
本稿では,Deep Reinforcement Learning (DRL)アルゴリズムを用いて,株式市場における収益性取引を生成するモデルを提案する。
我々は、市場が課す制約を考慮して、部分的に観測されたマルコフ決定プロセス(POMDP)モデルとして取引問題を定式化する。
次に, Twin Delayed Deep Deterministic Policy Gradient (TD3) アルゴリズムを用いて, 2.68 Sharpe Ratio を未知のデータセットに報告し, 定式化した POMDP 問題を解く。
論文 参考訳(メタデータ) (2022-07-05T11:34:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。