論文の概要: Finding Optimal Trading History in Reinforcement Learning for Stock Market Trading
- arxiv url: http://arxiv.org/abs/2502.12537v1
- Date: Tue, 18 Feb 2025 04:50:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-19 14:07:58.460237
- Title: Finding Optimal Trading History in Reinforcement Learning for Stock Market Trading
- Title(参考訳): 株式市場トレーディングのための強化学習における最適トレーディング履歴の探索
- Authors: Sina Montazeria, Haseebullah Jumakhanb, Amir Mirzaeinia,
- Abstract要約: 本稿では,2次元畳み込みニューラルネットワーク(CNN)を用いた金融深層学習(DRL)モデルにおける時間窓の最適化について検討する。
本稿では,時間領域をハイパーパラメータとして扱う新しい手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper investigates the optimization of temporal windows in Financial Deep Reinforcement Learning (DRL) models using 2D Convolutional Neural Networks (CNNs). We introduce a novel approach to treating the temporal field as a hyperparameter and examine its impact on model performance across various datasets and feature arrangements. We introduce a new hyperparameter for the CNN policy, proposing that this temporal field can and should be treated as a hyperparameter for these models. We examine the significance of this temporal field by iteratively expanding the window of observations presented to the CNN policy during the deep reinforcement learning process. Our iterative process involves progressively increasing the observation period from two weeks to twelve weeks, allowing us to examine the effects of different temporal windows on the model's performance. This window expansion is implemented in two settings. In one setting, we rearrange the features in the dataset to group them by company, allowing the model to have a full view of company data in its observation window and CNN kernel. In the second setting, we do not group the features by company, and features are arranged by category. Our study reveals that shorter temporal windows are most effective when no feature rearrangement to group per company is in effect. However, the model will utilize longer temporal windows and yield better performance once we introduce the feature rearrangement. To examine the consistency of our findings, we repeated our experiment on two datasets containing the same thirty companies from the Dow Jones Index but with different features in each dataset and consistently observed the above-mentioned patterns. The result is a trading model significantly outperforming global financial services firms such as the Global X Guru by the established Mirae Asset.
- Abstract(参考訳): 本稿では,2次元畳み込みニューラルネットワーク(CNN)を用いた金融深層学習(DRL)モデルにおける時間窓の最適化について検討する。
本稿では,時間領域をハイパーパラメータとして扱うための新しいアプローチを提案し,そのモデル性能への影響について検討する。
我々は,CNNポリシーに新たなハイパーパラメータを導入し,この時間領域をこれらのモデルに対するハイパーパラメータとして扱うことを提案する。
深層強化学習過程において,CNN政策に提示される観測窓を反復的に拡張することにより,この時間領域の重要性を検証した。
我々の反復的なプロセスは、観察期間を2週間から12週間に段階的に増加させ、異なる時間窓がモデルの性能に与える影響を調べることである。
このウィンドウ拡張は2つの設定で実装される。
ある設定では、データセットの機能を並べ替えて企業ごとにグループ化し、そのモデルがその観測ウィンドウとCNNカーネルに会社のデータの完全なビューを持てるようにします。
2つ目の設定では、特徴を企業別にグループ化せず、特徴をカテゴリ別に並べます。
本研究は, 企業ごとのグループ単位の配置変更が有効でない場合, 短時間の時間窓が最も有効であることを示す。
しかし、このモデルでは、より長い時間的ウィンドウを使用し、機能再構成を導入するとパフォーマンスが向上する。
結果の整合性を検討するため,Dow Jones Indexの同30社を含む2つのデータセットに対して,各データセットに異なる特徴を持ち,上記のパターンを一貫して観察する実験を行った。
その結果、Mirae AssetがGlobal X Guruのようなグローバル金融サービス会社を著しく上回る取引モデルとなった。
関連論文リスト
- Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Data-Juicer Sandbox: A Feedback-Driven Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは、フィードバック駆動の実験プラットフォームを提供し、コスト効率とデータとモデルの両方のガイド付き洗練を可能にする。
論文 参考訳(メタデータ) (2024-07-16T14:40:07Z) - PDETime: Rethinking Long-Term Multivariate Time Series Forecasting from
the perspective of partial differential equations [49.80959046861793]
本稿では,ニューラルPDEソルバの原理に着想を得た新しいLMTFモデルであるPDETimeを提案する。
7つの異なる時間的実世界のLMTFデータセットを用いた実験により、PDETimeがデータ固有の性質に効果的に適応できることが判明した。
論文 参考訳(メタデータ) (2024-02-25T17:39:44Z) - Efficient Observation Time Window Segmentation for Administrative Data
Machine Learning [1.8130068086063336]
機械学習モデルは、タイムスタンプ管理データにおける時間的傾向から学ぶことができると恩恵を受ける。
モデルのトレーニング時間とパフォーマンスは、各機能を異なる時間解像度で表現することで改善できる。
本論文は, ビンニング(TAIB)技術を検討するために, 計算効率のよい時系列解析手法を提案する。
論文 参考訳(メタデータ) (2024-01-29T20:18:51Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - TEMPO: Prompt-based Generative Pre-trained Transformer for Time Series Forecasting [24.834846119163885]
本稿では,時系列表現を効果的に学習できる新しいフレームワークTEMPOを提案する。
TEMPOは、様々な領域のデータから現実世界の時間現象を動的にモデル化する機能を拡張する。
論文 参考訳(メタデータ) (2023-10-08T00:02:25Z) - Deep Generative model with Hierarchical Latent Factors for Time Series
Anomaly Detection [40.21502451136054]
本研究は、時系列異常検出のための新しい生成モデルであるDGHLを提示する。
トップダウンの畳み込みネットワークは、新しい階層的な潜在空間を時系列ウィンドウにマッピングし、時間ダイナミクスを利用して情報を効率的にエンコードする。
提案手法は,4つのベンチマーク・データセットにおいて,現在の最先端モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-02-15T17:19:44Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Scene Understanding for Autonomous Driving [0.0]
Detectron2で提示されたRetinaNet, Faster R-CNN, Mask R-CNNの異なる構成の挙動を検討する。
関心のあるデータセット上でこれらのモデルを微調整した後、パフォーマンスの大幅な改善を観察します。
文脈外のデータセットを用いて異常な状況下で推論を行い、興味深い結果を示す。
論文 参考訳(メタデータ) (2021-05-11T09:50:05Z) - PSEUDo: Interactive Pattern Search in Multivariate Time Series with
Locality-Sensitive Hashing and Relevance Feedback [3.347485580830609]
PSEUDoは、マルチトラックシーケンシャルデータにおける視覚パターンを探索するための適応的機能学習技術である。
提案アルゴリズムは,サブ線形学習と推論時間を特徴とする。
我々は,PSEUDoの効率,精度,操縦性において優位性を示す。
論文 参考訳(メタデータ) (2021-04-30T13:00:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。