Fugu-MT 論文翻訳(概要): Deep Policy Gradient Methods in Commodity Markets

論文の概要: Deep Policy Gradient Methods in Commodity Markets

arxiv url: http://arxiv.org/abs/2308.01910v1
Date: Wed, 14 Jun 2023 11:50:23 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-23 15:31:41.020056
Title: Deep Policy Gradient Methods in Commodity Markets
Title（参考訳）: 商品市場におけるDeep Policy Gradient Methods
Authors: Jonas Hanetho
Abstract要約: トレーダーは流動性を提供し、ボラティリティを下げることで市場の安定化に重要な役割を果たしている。本論文は,商品取引における深層強化学習手法の有効性について考察する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The energy transition has increased the reliance on intermittent energy sources, destabilizing energy markets and causing unprecedented volatility, culminating in the global energy crisis of 2021. In addition to harming producers and consumers, volatile energy markets may jeopardize vital decarbonization efforts. Traders play an important role in stabilizing markets by providing liquidity and reducing volatility. Several mathematical and statistical models have been proposed for forecasting future returns. However, developing such models is non-trivial due to financial markets' low signal-to-noise ratios and nonstationary dynamics. This thesis investigates the effectiveness of deep reinforcement learning methods in commodities trading. It formalizes the commodities trading problem as a continuing discrete-time stochastic dynamical system. This system employs a novel time-discretization scheme that is reactive and adaptive to market volatility, providing better statistical properties for the sub-sampled financial time series. Two policy gradient algorithms, an actor-based and an actor-critic-based, are proposed for optimizing a transaction-cost- and risk-sensitive trading agent. The agent maps historical price observations to market positions through parametric function approximators utilizing deep neural network architectures, specifically CNNs and LSTMs. On average, the deep reinforcement learning models produce an 83 percent higher Sharpe ratio than the buy-and-hold baseline when backtested on front-month natural gas futures from 2017 to 2022. The backtests demonstrate that the risk tolerance of the deep reinforcement learning agents can be adjusted using a risk-sensitivity term. The actor-based policy gradient algorithm performs significantly better than the actor-critic-based algorithm, and the CNN-based models perform slightly better than those based on the LSTM.
Abstract（参考訳）: エネルギー移行は、断続的なエネルギー源への依存を高め、エネルギー市場を不安定化し、前例のないボラティリティを引き起こし、2021年の世界的なエネルギー危機で頂点に達した。生産者や消費者を害するだけでなく、揮発性エネルギー市場は重要な脱炭努力を危うくする可能性がある。トレーダーは流動性とボラティリティの低減によって市場の安定化に重要な役割を果たしている。将来のリターンを予測するための数理モデルと統計モデルが提案されている。しかし、金融市場の信号対雑音比や非定常力学のため、そのようなモデルの開発は簡単ではない。本論文は,商品取引における深層強化学習手法の有効性について考察する。商品取引問題を離散時間確率力学系として定式化する。このシステムは、市場のボラティリティに反応し適応し、サブサンプルの金融時系列により良い統計特性を提供する、新しい時間分散方式を採用している。取引コストとリスクに敏感な取引エージェントを最適化するために,アクターベースとアクタークリティカルベースという2つのポリシー勾配アルゴリズムを提案する。エージェントは、ディープニューラルネットワークアーキテクチャ、特にCNNとLSTMを用いたパラメトリック関数近似器を介して、過去の価格観測を市場ポジションにマッピングする。深層強化学習モデルの平均は、2017年から2022年までの前月の天然ガス先物試験において、買い買いベースラインよりも83%高いシャープ率を示している。バックテストにより, 深層強化学習エージェントのリスク耐性は, リスク感受性項を用いて調整可能であることが示された。アクターに基づくポリシー勾配アルゴリズムはアクター批判に基づくアルゴリズムよりも大幅に優れており、CNNベースのモデルはLSTMに基づくアルゴリズムよりも若干優れている。

関連論文リスト

Bayesian Robust Financial Trading with Adversarial Synthetic Market Data [15.993346478707686]
アルゴリズムトレーディングは、トレーディング決定を行うための機械学習モデルに依存している。インサンプルのパフォーマンスは高いが、これらのモデルは、進化する現実世界の市場体制に直面すると劣化することが多い。本稿では,マクロ条件付き生成モデルとロバストなポリシー学習を統合したベイズロバストフレームワークを提案する。
論文参考訳（メタデータ） (2026-01-14T13:15:46Z)
Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets [57.179679246370114]
金融分野では、強化学習(RL)エージェントは、価格に影響を与えない歴史的データに基づいて訓練されることが多い。展開中、これらのエージェントは、自身の取引が資産価格を変えることができるライブマーケットで取引する。従来のロバストなRLアプローチは、不確実性の集合に対して最悪のパフォーマンスを最適化することで、このモデルの誤特定に対処する。楕円型不確実性集合の新たなクラスを開発し,効率的かつ堅牢な政策評価を可能にする。
論文参考訳（メタデータ） (2025-10-22T18:22:25Z)
Trade in Minutes! Rationality-Driven Agentic System for Quantitative Financial Trading [57.28635022507172]
TiMiは、アーキテクチャ上、戦略開発を分単位のデプロイメントから切り離す合理性駆動型マルチエージェントシステムである。本稿では,マクロパターンからマイクロカスタマイズ,トレーディングボット実装のための階層型プログラミング設計,数学的リフレクションによって駆動されるクローズドループ最適化までの2層解析パラダイムを提案する。
論文参考訳（メタデータ） (2025-10-06T13:08:55Z)
Building crypto portfolios with agentic AI [46.348283638884425]
暗号通貨市場の急速な成長は投資家に新たな機会を与えたが、同時に高いボラティリティがもたらされた。本稿では,暗号アロケーションを自律的に構築し,評価するためのマルチエージェントシステムの実用化について述べる。
論文参考訳（メタデータ） (2025-07-11T18:03:51Z)
Multi-Agent Reinforcement Learning for Dynamic Pricing in Supply Chains: Benchmarking Strategic Agent Behaviours under Realistically Simulated Market Conditions [4.072683489517408]
本研究では,MARL(Multi-Agent Reinforcement Learning)がサプライチェーンの動的価格戦略をどのように改善するかを検討する。 MARLは、静的な価格ルールに縛られずに、突発的な戦略行動を導入し、ダイナミックな価格設定における将来の発展を知らせる。
論文参考訳（メタデータ） (2025-07-03T15:07:37Z)
ML-Based Bidding Price Prediction for Pay-As-Bid Ancillary Services Markets: A Use Case in the German Control Reserve Market [45.62331048595689]
本稿では,ドイツ支配予備市場を中心に,従量制サービス市場における入札価格の予測手法を提案する。サポートベクトル回帰、決定木、k-Nearest Neighborsなど、さまざまな機械学習モデルを評価し、ベンチマークモデルと比較する。分析の結果,提案手法はベースラインモデルと比較して27.43%から37.31%に改善することが示された。
論文参考訳（メタデータ） (2025-03-21T15:21:43Z)
Risk-averse policies for natural gas futures trading using distributional reinforcement learning [0.0]
本稿では,天然ガス先物取引における3つの分散RLアルゴリズムの有効性について検討する。私たちの知る限りでは、これらのアルゴリズムはトレーディングの文脈で一度も適用されていない。 CVaR を最大化するために C51 と IQN を訓練すると, リスク回避性のあるリスク感受性ポリシーが得られた。
論文参考訳（メタデータ） (2025-01-08T11:11:25Z)
An Evaluation of Deep Learning Models for Stock Market Trend Prediction [0.3277163122167433]
本研究では,S&P 500指数とブラジルETF EWZの日時閉値を用いた短期トレンド予測のための先進的なディープラーニングモデルの有効性について検討した。時系列予測に最適化されたxLSTM適応であるxLSTM-TSモデルを導入する。テストされたモデルの中で、xLSTM-TSは一貫して他のモデルよりも優れており、例えば、テスト精度72.82%、F1スコア73.16%をEWZの日次データセットで達成している。
論文参考訳（メタデータ） (2024-08-22T13:58:55Z)
When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.19252983108372]
LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。 StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。 AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文参考訳（メタデータ） (2024-07-15T06:49:30Z)
Supervised Autoencoder MLP for Financial Time Series Forecasting [0.0]
この調査は2010年1月1日から2022年4月30日までの取引資産としてS&P500指数、EUR/USD、BTC/USDに焦点を当てている。具体的には、シャープとインフォメーション比を用いて、ノイズ増大と三重障壁ラベルがリスク調整されたリターンに与える影響を具体的に調べる。その結果、教師付きオートエンコーダは、バランスの取れたノイズ増大とボトルネックサイズにより、戦略の有効性を著しく向上させることがわかった。
論文参考訳（メタデータ） (2024-04-02T11:44:37Z)
Diffusion Variational Autoencoder for Tackling Stochasticity in Multi-Step Regression Stock Price Prediction [54.21695754082441]
長期的地平線上での多段階の株価予測は、ボラティリティの予測に不可欠である。多段階の株価予測に対する現在の解決策は、主に単一段階の分類に基づく予測のために設計されている。深層階層型変分オートコーダ(VAE)と拡散確率的手法を組み合わせてセック2seqの株価予測を行う。本モデルでは, 予測精度と分散性の観点から, 最先端の解よりも優れていることを示す。
論文参考訳（メタデータ） (2023-08-18T16:21:15Z)
Commodities Trading through Deep Policy Gradient Methods [0.0]
商品取引問題を連続的な離散時間力学系として定式化する。アクターベースとアクタークリティカルベースの2つのポリシーアルゴリズムが導入された。先月末の天然ガス先物試験では、DRLモデルのシャープ比が買いと持ち株ベースラインと比較して83%高くなることが示されている。
論文参考訳（メタデータ） (2023-08-10T17:21:12Z)
HireVAE: An Online and Adaptive Factor Model Based on Hierarchical and Regime-Switch VAE [113.47287249524008]
オンラインで適応的な環境で株価予測を行うファクターモデルを構築することは、依然としてオープンな疑問である。本稿では,オンラインおよび適応型要素モデルであるHireVAEを,市場状況とストックワイド潜在要因の関係を埋め込んだ階層型潜在空間として提案する。 4つの一般的な実市場ベンチマークにおいて、提案されたHireVAEは、以前の手法よりもアクティブリターンの点で優れたパフォーマンスを示している。
論文参考訳（メタデータ） (2023-06-05T12:58:13Z)
Efficient Model-based Multi-agent Reinforcement Learning via Optimistic Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文参考訳（メタデータ） (2022-03-14T17:24:03Z)
Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文参考訳（メタデータ） (2022-03-07T18:59:54Z)
Bitcoin Transaction Strategy Construction Based on Deep Reinforcement Learning [8.431365407963629]
本研究では,PPO(Deep reinforcement Learning Algorithm-proximal Policy Optimization)に基づく,高速ビットコイン自動取引のためのフレームワークを提案する。提案したフレームワークは、ボラティリティと急上昇の期間を通じて過剰なリターンを得ることができるため、ディープラーニングに基づく単一暗号通貨取引戦略を構築するための扉を開くことができる。
論文参考訳（メタデータ） (2021-09-30T01:24:03Z)
Deep Stochastic Volatility Model [3.3970049571884204]
本論文では, 深部潜在変数モデルの枠組みに基づく深部ボラティリティモデル(DSVM)を提案する。フレキシブルなディープラーニングモデルを使用して、過去のリターンに対する将来のボラティリティの依存性を自動的に検出する。実データ分析では、DSVMはいくつかの一般的な代替ボラティリティモデルよりも優れています。
論文参考訳（メタデータ） (2021-02-25T03:25:33Z)
A Deep Reinforcement Learning Framework for Continuous Intraday Market Bidding [69.37299910149981]
再生可能エネルギー源統合の成功の鍵となる要素は、エネルギー貯蔵の利用である。欧州の継続的な日内市場におけるエネルギー貯蔵の戦略的関与をモデル化するための新しい枠組みを提案する。本アルゴリズムの分散バージョンは, サンプル効率のため, この問題を解決するために選択される。その結果, エージェントは, ベンチマーク戦略よりも平均的収益率の高い政策に収束することが示唆された。
論文参考訳（メタデータ） (2020-04-13T13:50:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。