Fugu-MT 論文翻訳(概要): An Ensemble Method of Deep Reinforcement Learning for Automated Cryptocurrency Trading

論文の概要: An Ensemble Method of Deep Reinforcement Learning for Automated Cryptocurrency Trading

arxiv url: http://arxiv.org/abs/2309.00626v1
Date: Thu, 27 Jul 2023 04:00:09 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-23 11:33:22.979753
Title: An Ensemble Method of Deep Reinforcement Learning for Automated Cryptocurrency Trading
Title（参考訳）: 自動暗号通貨取引のための深層強化学習の一手法
Authors: Shuyang Wang and Diego Klabjan
Abstract要約: 深層強化学習アルゴリズムにより訓練された貿易戦略の一般化性能を向上させるためのアンサンブル手法を提案する。提案手法は, 深層強化学習戦略とパッシブ投資戦略のベンチマークと比較し, サンプル外性能を向上する。
参考スコア（独自算出の注目度）: 16.78239969166596
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose an ensemble method to improve the generalization performance of trading strategies trained by deep reinforcement learning algorithms in a highly stochastic environment of intraday cryptocurrency portfolio trading. We adopt a model selection method that evaluates on multiple validation periods, and propose a novel mixture distribution policy to effectively ensemble the selected models. We provide a distributional view of the out-of-sample performance on granular test periods to demonstrate the robustness of the strategies in evolving market conditions, and retrain the models periodically to address non-stationarity of financial data. Our proposed ensemble method improves the out-of-sample performance compared with the benchmarks of a deep reinforcement learning strategy and a passive investment strategy.
Abstract（参考訳）: 本稿では,日々の暗号通貨ポートフォリオ取引の高度に確率的な環境において,深層強化学習アルゴリズムにより訓練されたトレーディング戦略の一般化性能を向上させるアンサンブル手法を提案する。複数の検証期間を評価するモデル選択法を採用し、選択したモデルを効果的にアンサンブルするための新しい混合分布ポリシーを提案する。金融データの非定常性に対処するために,市場状況の発展における戦略の堅牢性を示すため,粒度テスト期間におけるサンプル外性能の分布的ビューを提供し,モデルを定期的に再訓練する。提案手法は,深層強化学習戦略とパッシブ投資戦略のベンチマークと比較し,サンプル外の性能を向上させる。

関連論文リスト

Reinforcement Learning with Discrete Diffusion Policies for Combinatorial Action Spaces [57.466101098183884]
強化学習(Reinforcement Learning, RL)は、現実の多くの問題に共通する大規模なアクション空間にスケールするために苦労する。本稿では、複雑な環境下での高効率なポリシーとして、離散拡散モデルを訓練するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-09-26T21:53:36Z)
Do We Truly Need So Many Samples? Multi-LLM Repeated Sampling Efficiently Scales Test-Time Compute [55.330813919992465]
本稿では,テスト時間計算のスケールアップによるLCM性能向上のための,シンプルで効果的で費用効率のよい手法を提案する。当社の戦略は,複数のモデルを組み込んで,補完的な強みを活用するという,新たなツイストによって,繰り返しサンプリングされる投票フレームワークを基盤としています。
論文参考訳（メタデータ） (2025-04-01T13:13:43Z)
Mean--Variance Portfolio Selection by Continuous-Time Reinforcement Learning: Algorithms, Regret Analysis, and Empirical Study [10.404992912881601]
本研究では,観測可能な要因により株価が拡散する過程にある市場における平均-変動ポートフォリオの選択について検討する。本稿では,市場係数の学習や推定を行うことなく,事前委託投資戦略を直接学習する汎用データ駆動型RLアルゴリズムを提案する。その結果, 連続的RL戦略は, 特に揮発性クマ市場において, 常に最良であることが明らかとなった。
論文参考訳（メタデータ） (2024-12-08T15:31:10Z)
Optimal Execution with Reinforcement Learning [0.4972323953932129]
本研究では,強化学習による最適実行戦略の開発について検討する。本稿では,独自のMDPの定式化を行い,提案手法の結果を確認し,標準実行戦略に対して性能をベンチマークする。
論文参考訳（メタデータ） (2024-11-10T08:21:03Z)
Deep Reinforcement Learning for Online Optimal Execution Strategies [49.1574468325115]
本稿では,動的な金融市場における非マルコフ的最適実行戦略の学習に挑戦する。我々は,Deep Deterministic Policy Gradient(DDPG)に基づく新しいアクター批判アルゴリズムを提案する。提案アルゴリズムは最適実行戦略の近似に成功していることを示す。
論文参考訳（メタデータ） (2024-10-17T12:38:08Z)
Deep Learning for Options Trading: An End-To-End Approach [7.148312060227716]
我々は、高度にスケーラブルでデータ駆動の機械学習アルゴリズムを用いて、オプショントレーディング戦略に新しいアプローチを導入する。エンドツーエンドアプローチでトレーニングしたディープラーニングモデルは、既存のルールベースのトレーディング戦略よりも、リスク調整されたパフォーマンスが大幅に向上していることを示します。
論文参考訳（メタデータ） (2024-07-31T17:59:09Z)
Statistical arbitrage in multi-pair trading strategy based on graph clustering algorithms in US equities market [0.0]
本研究は,グラフクラスタリングアルゴリズムに基づく統計仲裁の新しい枠組みに基づく効果的な戦略の開発を目指す。この研究は、最適な信号検出とリスク管理のための統合的なアプローチを提供することを目指している。
論文参考訳（メタデータ） (2024-06-15T17:25:32Z)
Learning the Market: Sentiment-Based Ensemble Trading Agents [5.005352154557397]
株価取引のための感情分析と深層強化学習アンサンブルアルゴリズムの統合について検討する。当社のアプローチは、利益があり、堅牢で、リスク最小限の戦略をもたらすことを示しています。
論文参考訳（メタデータ） (2024-02-02T14:34:22Z)
Distributionally Robust Model-based Reinforcement Learning with Large State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文参考訳（メタデータ） (2023-09-05T13:42:11Z)
Model-based Multi-agent Policy Optimization with Adaptive Opponent-wise Rollouts [52.844741540236285]
マルチエージェント強化学習(MARL)におけるモデルベース手法について検討する。 AORPO(Adaptive Opponent-wise Rollout Policy)と呼ばれる新しい分散型モデルベースのMARL法を提案する。
論文参考訳（メタデータ） (2021-05-07T16:20:22Z)
Universal Trading for Order Execution with Oracle Policy Distillation [99.57416828489568]
本稿では,不完全な市場状態と注文実行のための最適な行動シーケンスとのギャップを埋める,新たなユニバーサル取引ポリシー最適化フレームワークを提案する。本研究の枠組みは,完全情報を持つ託宣教師による実践的最適実行に向けて,共通政策の学習を指導する上で有効であることを示す。
論文参考訳（メタデータ） (2021-01-28T05:52:18Z)
Stock2Vec: A Hybrid Deep Learning Framework for Stock Market Prediction with Representation Learning and Temporal Convolutional Network [71.25144476293507]
我々は、株式市場の日々の価格を予測するためのグローバルなハイブリッドディープラーニングフレームワークを開発することを提案した。表現学習によって、私たちはStock2Vecという埋め込みを導きました。我々のハイブリッドフレームワークは、両方の利点を統合し、いくつかの人気のあるベンチマークモデルよりも、株価予測タスクにおいてより良いパフォーマンスを達成する。
論文参考訳（メタデータ） (2020-09-29T22:54:30Z)
Adaptive Estimator Selection for Off-Policy Evaluation [48.66170976187225]
オフポリシー評価設定における推定器選択のための汎用的データ駆動手法を開発した。また,本手法の性能保証を確立し,オラクル推定器と競合することを示す。
論文参考訳（メタデータ） (2020-02-18T16:57:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。