論文の概要: An Ensemble Method of Deep Reinforcement Learning for Automated
Cryptocurrency Trading
- arxiv url: http://arxiv.org/abs/2309.00626v1
- Date: Thu, 27 Jul 2023 04:00:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 11:33:22.979753
- Title: An Ensemble Method of Deep Reinforcement Learning for Automated
Cryptocurrency Trading
- Title(参考訳): 自動暗号通貨取引のための深層強化学習の一手法
- Authors: Shuyang Wang and Diego Klabjan
- Abstract要約: 深層強化学習アルゴリズムにより訓練された貿易戦略の一般化性能を向上させるためのアンサンブル手法を提案する。
提案手法は, 深層強化学習戦略とパッシブ投資戦略のベンチマークと比較し, サンプル外性能を向上する。
- 参考スコア(独自算出の注目度): 16.78239969166596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an ensemble method to improve the generalization performance of
trading strategies trained by deep reinforcement learning algorithms in a
highly stochastic environment of intraday cryptocurrency portfolio trading. We
adopt a model selection method that evaluates on multiple validation periods,
and propose a novel mixture distribution policy to effectively ensemble the
selected models. We provide a distributional view of the out-of-sample
performance on granular test periods to demonstrate the robustness of the
strategies in evolving market conditions, and retrain the models periodically
to address non-stationarity of financial data. Our proposed ensemble method
improves the out-of-sample performance compared with the benchmarks of a deep
reinforcement learning strategy and a passive investment strategy.
- Abstract(参考訳): 本稿では,日々の暗号通貨ポートフォリオ取引の高度に確率的な環境において,深層強化学習アルゴリズムにより訓練されたトレーディング戦略の一般化性能を向上させるアンサンブル手法を提案する。
複数の検証期間を評価するモデル選択法を採用し、選択したモデルを効果的にアンサンブルするための新しい混合分布ポリシーを提案する。
金融データの非定常性に対処するために,市場状況の発展における戦略の堅牢性を示すため,粒度テスト期間におけるサンプル外性能の分布的ビューを提供し,モデルを定期的に再訓練する。
提案手法は,深層強化学習戦略とパッシブ投資戦略のベンチマークと比較し,サンプル外の性能を向上させる。
関連論文リスト
- Bridging Diversity and Uncertainty in Active learning with
Self-Supervised Pre-Training [23.573986817769025]
本研究は,能動学習における多様性に基づく,不確実性に基づくサンプリング戦略の統合について論じる。
我々は,コールドスタート問題を軽減し,さまざまなデータレベルの強いパフォーマンスを維持しつつ,TCMという単純な手法を導入する。
論文 参考訳(メタデータ) (2024-03-06T14:18:24Z) - Learning the Market: Sentiment-Based Ensemble Trading Agents [5.193582840789407]
株価取引のための感情分析と深層強化学習アンサンブルアルゴリズムの統合を提案する。
当社のアプローチは、利益があり、堅牢で、リスク最小限の戦略をもたらすことを示しています。
論文 参考訳(メタデータ) (2024-02-02T14:34:22Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Deep Reinforcement Learning for Exact Combinatorial Optimization:
Learning to Branch [13.024115985194932]
本稿では、強化学習(RL)パラダイムを用いた最適化において、データラベリングと推論の問題を解決するための新しいアプローチを提案する。
我々は模倣学習を用いてRLエージェントをブートストラップし、PPO(Proximal Policy)を使用してグローバルな最適なアクションを探索する。
論文 参考訳(メタデータ) (2022-06-14T16:35:58Z) - Bitcoin Transaction Strategy Construction Based on Deep Reinforcement
Learning [8.431365407963629]
本研究では,PPO(Deep reinforcement Learning Algorithm-proximal Policy Optimization)に基づく,高速ビットコイン自動取引のためのフレームワークを提案する。
提案したフレームワークは、ボラティリティと急上昇の期間を通じて過剰なリターンを得ることができるため、ディープラーニングに基づく単一暗号通貨取引戦略を構築するための扉を開くことができる。
論文 参考訳(メタデータ) (2021-09-30T01:24:03Z) - Model-based Multi-agent Policy Optimization with Adaptive Opponent-wise
Rollouts [52.844741540236285]
マルチエージェント強化学習(MARL)におけるモデルベース手法について検討する。
AORPO(Adaptive Opponent-wise Rollout Policy)と呼ばれる新しい分散型モデルベースのMARL法を提案する。
論文 参考訳(メタデータ) (2021-05-07T16:20:22Z) - Universal Trading for Order Execution with Oracle Policy Distillation [99.57416828489568]
本稿では,不完全な市場状態と注文実行のための最適な行動シーケンスとのギャップを埋める,新たなユニバーサル取引ポリシー最適化フレームワークを提案する。
本研究の枠組みは,完全情報を持つ託宣教師による実践的最適実行に向けて,共通政策の学習を指導する上で有効であることを示す。
論文 参考訳(メタデータ) (2021-01-28T05:52:18Z) - Stock2Vec: A Hybrid Deep Learning Framework for Stock Market Prediction
with Representation Learning and Temporal Convolutional Network [71.25144476293507]
我々は、株式市場の日々の価格を予測するためのグローバルなハイブリッドディープラーニングフレームワークを開発することを提案した。
表現学習によって、私たちはStock2Vecという埋め込みを導きました。
我々のハイブリッドフレームワークは、両方の利点を統合し、いくつかの人気のあるベンチマークモデルよりも、株価予測タスクにおいてより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-09-29T22:54:30Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - Adaptive Estimator Selection for Off-Policy Evaluation [48.66170976187225]
オフポリシー評価設定における推定器選択のための汎用的データ駆動手法を開発した。
また,本手法の性能保証を確立し,オラクル推定器と競合することを示す。
論文 参考訳(メタデータ) (2020-02-18T16:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。