論文の概要: Deep Policy Gradient Methods in Commodity Markets
- arxiv url: http://arxiv.org/abs/2308.01910v1
- Date: Wed, 14 Jun 2023 11:50:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 15:31:41.020056
- Title: Deep Policy Gradient Methods in Commodity Markets
- Title(参考訳): 商品市場におけるDeep Policy Gradient Methods
- Authors: Jonas Hanetho
- Abstract要約: トレーダーは流動性を提供し、ボラティリティを下げることで市場の安定化に重要な役割を果たしている。
本論文は,商品取引における深層強化学習手法の有効性について考察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The energy transition has increased the reliance on intermittent energy
sources, destabilizing energy markets and causing unprecedented volatility,
culminating in the global energy crisis of 2021. In addition to harming
producers and consumers, volatile energy markets may jeopardize vital
decarbonization efforts. Traders play an important role in stabilizing markets
by providing liquidity and reducing volatility. Several mathematical and
statistical models have been proposed for forecasting future returns. However,
developing such models is non-trivial due to financial markets' low
signal-to-noise ratios and nonstationary dynamics.
This thesis investigates the effectiveness of deep reinforcement learning
methods in commodities trading. It formalizes the commodities trading problem
as a continuing discrete-time stochastic dynamical system. This system employs
a novel time-discretization scheme that is reactive and adaptive to market
volatility, providing better statistical properties for the sub-sampled
financial time series. Two policy gradient algorithms, an actor-based and an
actor-critic-based, are proposed for optimizing a transaction-cost- and
risk-sensitive trading agent. The agent maps historical price observations to
market positions through parametric function approximators utilizing deep
neural network architectures, specifically CNNs and LSTMs.
On average, the deep reinforcement learning models produce an 83 percent
higher Sharpe ratio than the buy-and-hold baseline when backtested on
front-month natural gas futures from 2017 to 2022. The backtests demonstrate
that the risk tolerance of the deep reinforcement learning agents can be
adjusted using a risk-sensitivity term. The actor-based policy gradient
algorithm performs significantly better than the actor-critic-based algorithm,
and the CNN-based models perform slightly better than those based on the LSTM.
- Abstract(参考訳): エネルギー移行は、断続的なエネルギー源への依存を高め、エネルギー市場を不安定化し、前例のないボラティリティを引き起こし、2021年の世界的なエネルギー危機で頂点に達した。
生産者や消費者を害するだけでなく、揮発性エネルギー市場は重要な脱炭努力を危うくする可能性がある。
トレーダーは流動性とボラティリティの低減によって市場の安定化に重要な役割を果たしている。
将来のリターンを予測するための数理モデルと統計モデルが提案されている。
しかし、金融市場の信号対雑音比や非定常力学のため、そのようなモデルの開発は簡単ではない。
本論文は,商品取引における深層強化学習手法の有効性について考察する。
商品取引問題を離散時間確率力学系として定式化する。
このシステムは、市場のボラティリティに反応し適応し、サブサンプルの金融時系列により良い統計特性を提供する、新しい時間分散方式を採用している。
取引コストとリスクに敏感な取引エージェントを最適化するために,アクターベースとアクタークリティカルベースという2つのポリシー勾配アルゴリズムを提案する。
エージェントは、ディープニューラルネットワークアーキテクチャ、特にCNNとLSTMを用いたパラメトリック関数近似器を介して、過去の価格観測を市場ポジションにマッピングする。
深層強化学習モデルの平均は、2017年から2022年までの前月の天然ガス先物試験において、買い買いベースラインよりも83%高いシャープ率を示している。
バックテストにより, 深層強化学習エージェントのリスク耐性は, リスク感受性項を用いて調整可能であることが示された。
アクターに基づくポリシー勾配アルゴリズムはアクター批判に基づくアルゴリズムよりも大幅に優れており、CNNベースのモデルはLSTMに基づくアルゴリズムよりも若干優れている。
関連論文リスト
- Supervised Autoencoder MLP for Financial Time Series Forecasting [0.0]
この調査は2010年1月1日から2022年4月30日までの取引資産としてS&P500指数、EUR/USD、BTC/USDに焦点を当てている。
具体的には、シャープとインフォメーション比を用いて、ノイズ増大と三重障壁ラベルがリスク調整されたリターンに与える影響を具体的に調べる。
その結果、教師付きオートエンコーダは、バランスの取れたノイズ増大とボトルネックサイズにより、戦略の有効性を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-04-02T11:44:37Z) - Diffusion Variational Autoencoder for Tackling Stochasticity in
Multi-Step Regression Stock Price Prediction [54.21695754082441]
長期的地平線上での多段階の株価予測は、ボラティリティの予測に不可欠である。
多段階の株価予測に対する現在の解決策は、主に単一段階の分類に基づく予測のために設計されている。
深層階層型変分オートコーダ(VAE)と拡散確率的手法を組み合わせてセック2seqの株価予測を行う。
本モデルでは, 予測精度と分散性の観点から, 最先端の解よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-18T16:21:15Z) - Commodities Trading through Deep Policy Gradient Methods [0.0]
商品取引問題を連続的な離散時間力学系として定式化する。
アクターベースとアクタークリティカルベースの2つのポリシーアルゴリズムが導入された。
先月末の天然ガス先物試験では、DRLモデルのシャープ比が買いと持ち株ベースラインと比較して83%高くなることが示されている。
論文 参考訳(メタデータ) (2023-08-10T17:21:12Z) - HireVAE: An Online and Adaptive Factor Model Based on Hierarchical and
Regime-Switch VAE [113.47287249524008]
オンラインで適応的な環境で株価予測を行うファクターモデルを構築することは、依然としてオープンな疑問である。
本稿では,オンラインおよび適応型要素モデルであるHireVAEを,市場状況とストックワイド潜在要因の関係を埋め込んだ階層型潜在空間として提案する。
4つの一般的な実市場ベンチマークにおいて、提案されたHireVAEは、以前の手法よりもアクティブリターンの点で優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-06-05T12:58:13Z) - DeepVol: Volatility Forecasting from High-Frequency Data with Dilated
Causal Convolutions [78.6363825307044]
本稿では,Dilated Causal Convolutionsに基づくDeepVolモデルを提案する。
拡張畳み込みフィルタは日内財務データから関連情報を抽出するのに最適であることを示す。
論文 参考訳(メタデータ) (2022-09-23T16:13:47Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z) - Bitcoin Transaction Strategy Construction Based on Deep Reinforcement
Learning [8.431365407963629]
本研究では,PPO(Deep reinforcement Learning Algorithm-proximal Policy Optimization)に基づく,高速ビットコイン自動取引のためのフレームワークを提案する。
提案したフレームワークは、ボラティリティと急上昇の期間を通じて過剰なリターンを得ることができるため、ディープラーニングに基づく単一暗号通貨取引戦略を構築するための扉を開くことができる。
論文 参考訳(メタデータ) (2021-09-30T01:24:03Z) - Deep Stochastic Volatility Model [3.3970049571884204]
本論文では, 深部潜在変数モデルの枠組みに基づく深部ボラティリティモデル(DSVM)を提案する。
フレキシブルなディープラーニングモデルを使用して、過去のリターンに対する将来のボラティリティの依存性を自動的に検出する。
実データ分析では、DSVMはいくつかの一般的な代替ボラティリティモデルよりも優れています。
論文 参考訳(メタデータ) (2021-02-25T03:25:33Z) - GA-MSSR: Genetic Algorithm Maximizing Sharpe and Sterling Ratio Method
for RoboTrading [0.4568777157687961]
外国為替は世界最大の金融市場である。
ほとんどの文献は、歴史的価格情報と技術指標を訓練に用いた。
この問題に対処するため,我々は,技術指標と取引規則から派生した取引規則の特徴を設計した。
論文 参考訳(メタデータ) (2020-08-16T05:33:35Z) - A Deep Reinforcement Learning Framework for Continuous Intraday Market
Bidding [69.37299910149981]
再生可能エネルギー源統合の成功の鍵となる要素は、エネルギー貯蔵の利用である。
欧州の継続的な日内市場におけるエネルギー貯蔵の戦略的関与をモデル化するための新しい枠組みを提案する。
本アルゴリズムの分散バージョンは, サンプル効率のため, この問題を解決するために選択される。
その結果, エージェントは, ベンチマーク戦略よりも平均的収益率の高い政策に収束することが示唆された。
論文 参考訳(メタデータ) (2020-04-13T13:50:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。