論文の概要: An Ensemble Method of Deep Reinforcement Learning for Automated
Cryptocurrency Trading
- arxiv url: http://arxiv.org/abs/2309.00626v1
- Date: Thu, 27 Jul 2023 04:00:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 11:33:22.979753
- Title: An Ensemble Method of Deep Reinforcement Learning for Automated
Cryptocurrency Trading
- Title(参考訳): 自動暗号通貨取引のための深層強化学習の一手法
- Authors: Shuyang Wang and Diego Klabjan
- Abstract要約: 深層強化学習アルゴリズムにより訓練された貿易戦略の一般化性能を向上させるためのアンサンブル手法を提案する。
提案手法は, 深層強化学習戦略とパッシブ投資戦略のベンチマークと比較し, サンプル外性能を向上する。
- 参考スコア(独自算出の注目度): 16.78239969166596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an ensemble method to improve the generalization performance of
trading strategies trained by deep reinforcement learning algorithms in a
highly stochastic environment of intraday cryptocurrency portfolio trading. We
adopt a model selection method that evaluates on multiple validation periods,
and propose a novel mixture distribution policy to effectively ensemble the
selected models. We provide a distributional view of the out-of-sample
performance on granular test periods to demonstrate the robustness of the
strategies in evolving market conditions, and retrain the models periodically
to address non-stationarity of financial data. Our proposed ensemble method
improves the out-of-sample performance compared with the benchmarks of a deep
reinforcement learning strategy and a passive investment strategy.
- Abstract(参考訳): 本稿では,日々の暗号通貨ポートフォリオ取引の高度に確率的な環境において,深層強化学習アルゴリズムにより訓練されたトレーディング戦略の一般化性能を向上させるアンサンブル手法を提案する。
複数の検証期間を評価するモデル選択法を採用し、選択したモデルを効果的にアンサンブルするための新しい混合分布ポリシーを提案する。
金融データの非定常性に対処するために,市場状況の発展における戦略の堅牢性を示すため,粒度テスト期間におけるサンプル外性能の分布的ビューを提供し,モデルを定期的に再訓練する。
提案手法は,深層強化学習戦略とパッシブ投資戦略のベンチマークと比較し,サンプル外の性能を向上させる。
関連論文リスト
- Optimal Execution with Reinforcement Learning [0.4972323953932129]
本研究では,強化学習による最適実行戦略の開発について検討する。
本稿では,独自のMDPの定式化を行い,提案手法の結果を確認し,標準実行戦略に対して性能をベンチマークする。
論文 参考訳(メタデータ) (2024-11-10T08:21:03Z) - Deep Reinforcement Learning for Online Optimal Execution Strategies [49.1574468325115]
本稿では,動的な金融市場における非マルコフ的最適実行戦略の学習に挑戦する。
我々は,Deep Deterministic Policy Gradient(DDPG)に基づく新しいアクター批判アルゴリズムを提案する。
提案アルゴリズムは最適実行戦略の近似に成功していることを示す。
論文 参考訳(メタデータ) (2024-10-17T12:38:08Z) - Deep Learning for Options Trading: An End-To-End Approach [7.148312060227716]
我々は、高度にスケーラブルでデータ駆動の機械学習アルゴリズムを用いて、オプショントレーディング戦略に新しいアプローチを導入する。
エンドツーエンドアプローチでトレーニングしたディープラーニングモデルは、既存のルールベースのトレーディング戦略よりも、リスク調整されたパフォーマンスが大幅に向上していることを示します。
論文 参考訳(メタデータ) (2024-07-31T17:59:09Z) - Statistical arbitrage in multi-pair trading strategy based on graph clustering algorithms in US equities market [0.0]
本研究は,グラフクラスタリングアルゴリズムに基づく統計仲裁の新しい枠組みに基づく効果的な戦略の開発を目指す。
この研究は、最適な信号検出とリスク管理のための統合的なアプローチを提供することを目指している。
論文 参考訳(メタデータ) (2024-06-15T17:25:32Z) - Learning the Market: Sentiment-Based Ensemble Trading Agents [5.005352154557397]
株価取引のための感情分析と深層強化学習アンサンブルアルゴリズムの統合について検討する。
当社のアプローチは、利益があり、堅牢で、リスク最小限の戦略をもたらすことを示しています。
論文 参考訳(メタデータ) (2024-02-02T14:34:22Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Model-based Multi-agent Policy Optimization with Adaptive Opponent-wise
Rollouts [52.844741540236285]
マルチエージェント強化学習(MARL)におけるモデルベース手法について検討する。
AORPO(Adaptive Opponent-wise Rollout Policy)と呼ばれる新しい分散型モデルベースのMARL法を提案する。
論文 参考訳(メタデータ) (2021-05-07T16:20:22Z) - Universal Trading for Order Execution with Oracle Policy Distillation [99.57416828489568]
本稿では,不完全な市場状態と注文実行のための最適な行動シーケンスとのギャップを埋める,新たなユニバーサル取引ポリシー最適化フレームワークを提案する。
本研究の枠組みは,完全情報を持つ託宣教師による実践的最適実行に向けて,共通政策の学習を指導する上で有効であることを示す。
論文 参考訳(メタデータ) (2021-01-28T05:52:18Z) - Stock2Vec: A Hybrid Deep Learning Framework for Stock Market Prediction
with Representation Learning and Temporal Convolutional Network [71.25144476293507]
我々は、株式市場の日々の価格を予測するためのグローバルなハイブリッドディープラーニングフレームワークを開発することを提案した。
表現学習によって、私たちはStock2Vecという埋め込みを導きました。
我々のハイブリッドフレームワークは、両方の利点を統合し、いくつかの人気のあるベンチマークモデルよりも、株価予測タスクにおいてより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-09-29T22:54:30Z) - Adaptive Estimator Selection for Off-Policy Evaluation [48.66170976187225]
オフポリシー評価設定における推定器選択のための汎用的データ駆動手法を開発した。
また,本手法の性能保証を確立し,オラクル推定器と競合することを示す。
論文 参考訳(メタデータ) (2020-02-18T16:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。