論文の概要: Natural-gas storage modelling by deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2511.02646v1
- Date: Tue, 04 Nov 2025 15:13:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:06.087893
- Title: Natural-gas storage modelling by deep reinforcement learning
- Title(参考訳): 深部強化学習による天然ガス貯蔵モデリング
- Authors: Tiziano Balaconi, Aldo Glielmo, Marco Taboga,
- Abstract要約: GasRLは、天然ガス市場のキャリブレーションされた表現を、深層強化学習(RL)で訓練されたストレージ運用ポリシーのモデルと組み合わせたシミュレータである。
我々は、最適な備蓄管理が均衡価格や需要・供給のダイナミクスにどのように影響するかを分析するためにそれを利用する。
本研究では,EUが管理する最小記憶閾値の影響をシミュレータを用いて評価する方法について述べる。
- 参考スコア(独自算出の注目度): 0.764671395172401
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce GasRL, a simulator that couples a calibrated representation of the natural gas market with a model of storage-operator policies trained with deep reinforcement learning (RL). We use it to analyse how optimal stockpile management affects equilibrium prices and the dynamics of demand and supply. We test various RL algorithms and find that Soft Actor Critic (SAC) exhibits superior performance in the GasRL environment: multiple objectives of storage operators - including profitability, robust market clearing and price stabilisation - are successfully achieved. Moreover, the equilibrium price dynamics induced by SAC-derived optimal policies have characteristics, such as volatility and seasonality, that closely match those of real-world prices. Remarkably, this adherence to the historical distribution of prices is obtained without explicitly calibrating the model to price data. We show how the simulator can be used to assess the effects of EU-mandated minimum storage thresholds. We find that such thresholds have a positive effect on market resilience against unanticipated shifts in the distribution of supply shocks. For example, with unusually large shocks, market disruptions are averted more often if a threshold is in place.
- Abstract(参考訳): 本稿では,天然ガス市場のキャリブレーションされた表現を,深層強化学習(RL)で訓練されたストレージ運用ポリシーのモデルと組み合わせたシミュレータであるGasRLを紹介する。
我々は、最適な備蓄管理が均衡価格や需要・供給のダイナミクスにどのように影響するかを分析するためにそれを利用する。
我々は様々なRLアルゴリズムを試験し、Soft Actor Critic(SAC)がGasRL環境において優れた性能を示すことを発見した。
さらに、SAC由来の最適政策によって引き起こされる均衡価格のダイナミクスは、変動性や季節性など、現実世界の価格と密接に一致する特性を持つ。
注目すべきは、この価格の歴史的分布への固執は、モデルを価格データに明示的に調整することなく得られることである。
本研究では,EUが管理する最小ストレージ閾値の影響を評価するためにシミュレータをどのように利用できるかを示す。
このような閾値は、供給ショックの分布の予期せぬ変化に対する市場のレジリエンスに肯定的な影響を及ぼす。
例えば、異常に大きなショックを受けた場合、しきい値が設定されている場合、市場の混乱は回避される。
関連論文リスト
- Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets [57.179679246370114]
金融分野では、強化学習(RL)エージェントは、価格に影響を与えない歴史的データに基づいて訓練されることが多い。
展開中、これらのエージェントは、自身の取引が資産価格を変えることができるライブマーケットで取引する。
従来のロバストなRLアプローチは、不確実性の集合に対して最悪のパフォーマンスを最適化することで、このモデルの誤特定に対処する。
楕円型不確実性集合の新たなクラスを開発し,効率的かつ堅牢な政策評価を可能にする。
論文 参考訳(メタデータ) (2025-10-22T18:22:25Z) - BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping [69.74252624161652]
適応クリッピング(BAPO)を用いたBAlanced Policy Optimizationを提案する。
BAPOはクリッピングバウンダリを動的に調整し、適応的に正と負のコントリビューションを再バランスさせ、エントロピーを保持し、RL最適化を安定化させる。
AIME 2024とAIME 2025ベンチマークでは、7B BAPOモデルがSkyWork-OR1-7Bのようなオープンソースモデルを上回っています。
論文 参考訳(メタデータ) (2025-10-21T12:55:04Z) - CSPO: Cross-Market Synergistic Stock Price Movement Forecasting with Pseudo-volatility Optimization [14.241290261347281]
Pseudo-volatility Optimization (CSPO)によるクロスマーケット・シナジーの枠組みを紹介する。
CSPOは、外部の未来の知識を活用するために効果的なディープ・ニューラル・アーキテクチャを実装している。
CSPOは、ストック固有の予測信頼性をモデル化するために擬似ボラティリティを取り入れている。
論文 参考訳(メタデータ) (2025-03-26T18:58:15Z) - Deep Reinforcement Learning Agents for Strategic Production Policies in Microeconomic Market Simulations [1.6499388997661122]
複数の生産者と競合する市場で効果的な政策を得るためのDRLベースのアプローチを提案する。
我々のフレームワークは、静的およびランダムな戦略を一貫して上回るいくつかのシミュレーションに適応的な生産ポリシーを学習することを可能にする。
その結果,DRLで訓練したエージェントは生産水準を戦略的に調整し,長期利益率を最大化できることがわかった。
論文 参考訳(メタデータ) (2024-10-27T18:38:05Z) - Deep Hedging with Market Impact [0.20482269513546458]
本稿では,Deep Reinforcement Learning(DRL)に基づく新しい市場インパクト動的ヘッジモデルを提案する。
DRLモデルから得られた最適ポリシーは、いくつかのオプションヘッジシミュレーションを用いて分析され、デルタヘッジのような一般的な手順と比較される。
論文 参考訳(メタデータ) (2024-02-20T19:08:24Z) - Structured Dynamic Pricing: Optimal Regret in a Global Shrinkage Model [50.06663781566795]
消費者の嗜好と価格感が時間とともに変化する動的モデルを考える。
我々は,モデルパラメータの順序を事前に把握している透視者と比較して,収益損失が予想される,後悔による動的価格政策の性能を計測する。
提案した政策の最適性を示すだけでなく,政策立案のためには,利用可能な構造情報を組み込むことが不可欠であることを示す。
論文 参考訳(メタデータ) (2023-03-28T00:23:23Z) - Predictive Accuracy of a Hybrid Generalized Long Memory Model for Short
Term Electricity Price Forecasting [0.0]
本研究では、一般化長メモリ自己回帰モデル(k-factor GARMA)に基づく新しいハイブリッドモデルの予測性能について検討する。
提案モデルの性能を北プール電力市場のデータを用いて評価した。
論文 参考訳(メタデータ) (2022-04-18T12:21:25Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Multi-Asset Spot and Option Market Simulation [52.77024349608834]
正規化フローに基づく1つの基盤となる1つのマーケットシミュレータを現実的に構築する。
本研究では, 正規化流れの条件付き可逆性を活用し, 独立シミュレータの連立分布をキャリブレーションするスケーラブルな手法を提案する。
論文 参考訳(メタデータ) (2021-12-13T17:34:28Z) - Stock Price Prediction Under Anomalous Circumstances [81.37657557441649]
本稿では,異常な状況下での株価の変動パターンを捉えることを目的とする。
ARIMAとLSTMのモデルは、シングルストックレベル、業界レベル、一般市場レベルでトレーニングします。
2016年から2020年にかけての100社の株価に基づいて、平均予測精度は98%に達した。
論文 参考訳(メタデータ) (2021-09-14T18:50:38Z) - Ensemble Forecasting for Intraday Electricity Prices: Simulating
Trajectories [0.0]
近年の研究では、時間単位のドイツの日内連続市場は弱い状態にあることが示されている。
時間内電力価格の確率予測は、トレーディングウィンドウ毎に軌跡をシミュレートして行う。
この調査は、過去3時間でドイツの日内連続市場における価格分布を予測することを目的としているが、このアプローチは、特にヨーロッパでは、他の連続市場への適用を可能にする。
論文 参考訳(メタデータ) (2020-05-04T10:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。