論文の概要: Bitcoin Transaction Strategy Construction Based on Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2109.14789v1
- Date: Thu, 30 Sep 2021 01:24:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 14:34:00.456765
- Title: Bitcoin Transaction Strategy Construction Based on Deep Reinforcement
Learning
- Title(参考訳): 深層強化学習に基づくビットコイン取引戦略構築
- Authors: Fengrui Liu, Yang Li, Baitong Li, Jiaxin Li, Huiyang Xie
- Abstract要約: 本研究では,PPO(Deep reinforcement Learning Algorithm-proximal Policy Optimization)に基づく,高速ビットコイン自動取引のためのフレームワークを提案する。
提案したフレームワークは、ボラティリティと急上昇の期間を通じて過剰なリターンを得ることができるため、ディープラーニングに基づく単一暗号通貨取引戦略を構築するための扉を開くことができる。
- 参考スコア(独自算出の注目度): 8.431365407963629
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The emerging cryptocurrency market has lately received great attention for
asset allocation due to its decentralization uniqueness. However, its
volatility and brand new trading mode have made it challenging to devising an
acceptable automatically-generating strategy. This study proposes a framework
for automatic high-frequency bitcoin transactions based on a deep reinforcement
learning algorithm-proximal policy optimization (PPO). The framework creatively
regards the transaction process as actions, returns as awards and prices as
states to align with the idea of reinforcement learning. It compares advanced
machine learning-based models for static price predictions including support
vector machine (SVM), multi-layer perceptron (MLP), long short-term memory
(LSTM), temporal convolutional network (TCN), and Transformer by applying them
to the real-time bitcoin price and the experimental results demonstrate that
LSTM outperforms. Then an automatically-generating transaction strategy is
constructed building on PPO with LSTM as the basis to construct the policy.
Extensive empirical studies validate that the proposed method performs
superiorly to various common trading strategy benchmarks for a single financial
product. The approach is able to trade bitcoins in a simulated environment with
synchronous data and obtains a 31.67% more return than that of the best
benchmark, improving the benchmark by 12.75%. The proposed framework can earn
excess returns through both the period of volatility and surge, which opens the
door to research on building a single cryptocurrency trading strategy based on
deep learning. Visualizations of trading the process show how the model handles
high-frequency transactions to provide inspiration and demonstrate that it can
be expanded to other financial products.
- Abstract(参考訳): 新興通貨市場は近年、分散化の独自性により資産配分に大きな注目を集めている。
しかし、そのボラティリティと新しいトレーディングモードは、許容可能な自動生成戦略を考案することを困難にしている。
本研究では,PPO(Deep reinforcement learning algorithm-proximal Policy Optimization)に基づく,高速ビットコイン取引の自動処理フレームワークを提案する。
この枠組みは、トランザクションプロセスを行動とみなし、強化学習の考え方と整合する国家として賞と価格として返却する。
サポートベクタマシン(SVM)、多層パーセプトロン(MLP)、長期記憶(LSTM)、時間畳み込みネットワーク(TCN)、Transformerなど、静的価格予測のための高度な機械学習ベースのモデルを比較し、リアルタイムbitcoin価格に適用することでLSTMのパフォーマンスが向上することを示した。
次に、ポリシー構築の基盤としてLSTMを用いてPPO上に自動生成トランザクション戦略を構築する。
大規模な実証研究により,提案手法は単一金融商品の様々な共通取引戦略ベンチマークよりも優れた性能を示した。
このアプローチは、同期データでシミュレーション環境でbitcoinを交換することができ、最高のベンチマークよりも31.67%高いリターンを獲得し、ベンチマークを12.75%改善する。
提案したフレームワークは、ボラティリティと急上昇の期間を通じて過剰なリターンを得ることができるため、ディープラーニングに基づく単一暗号通貨取引戦略を構築するための扉を開くことができる。
プロセスの可視化は、モデルが高周波トランザクションをどのように扱うかを示し、インスピレーションを与え、他の金融製品に拡張できることを示す。
関連論文リスト
- When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.19252983108372]
LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。
StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。
AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文 参考訳(メタデータ) (2024-07-15T06:49:30Z) - A Deep Reinforcement Learning Approach for Trading Optimization in the Forex Market with Multi-Agent Asynchronous Distribution [0.0]
この研究は、最先端の非同期アドバンテージ・アクター・クリティカル(A3C)アルゴリズムを用いたマルチエージェント(MA)RLフレームワークの適用を先導する。
ロックとロックなしの2つの異なるA3Cが提案され、単一通貨とマルチ通貨で訓練された。
以上の結果から,両モデルが近似政策最適化モデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-05-30T12:07:08Z) - A Framework for Empowering Reinforcement Learning Agents with Causal Analysis: Enhancing Automated Cryptocurrency Trading [1.4356611205757077]
本研究は,Coin, Litecoin, Ripple, Tetherの5つの暗号通貨を取引する複雑さに対処するための強化学習(RL)フレームワークの開発に焦点をあてる。
本稿では,ベイズ的および動的ベイズ的ネットワーク技術を統合し,貿易決定におけるRLエージェントの強化を目的としたCausalReinforceNet(CRN)フレームワークを提案する。
本稿では,このフレームワークを用いて,Bell-and-HoldベンチマークとベースラインRLモデルと比較して,異なるRLアルゴリズムを用いて性能を解析する2つのエージェントを開発した。
論文 参考訳(メタデータ) (2023-10-14T01:08:52Z) - Cryptocurrency Portfolio Optimization by Neural Networks [81.20955733184398]
本稿では,これらの投資商品を活用するために,ニューラルネットワークに基づく効果的なアルゴリズムを提案する。
シャープ比を最大化するために、各アセットの割り当て重量を時間間隔で出力するディープニューラルネットワークを訓練する。
ネットワークの特定の資産に対するバイアスを規制する新たな損失項を提案し,最小分散戦略に近い割り当て戦略をネットワークに学習させる。
論文 参考訳(メタデータ) (2023-10-02T12:33:28Z) - Diffusion Variational Autoencoder for Tackling Stochasticity in
Multi-Step Regression Stock Price Prediction [54.21695754082441]
長期的地平線上での多段階の株価予測は、ボラティリティの予測に不可欠である。
多段階の株価予測に対する現在の解決策は、主に単一段階の分類に基づく予測のために設計されている。
深層階層型変分オートコーダ(VAE)と拡散確率的手法を組み合わせてセック2seqの株価予測を行う。
本モデルでは, 予測精度と分散性の観点から, 最先端の解よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-18T16:21:15Z) - Commodities Trading through Deep Policy Gradient Methods [0.0]
商品取引問題を連続的な離散時間力学系として定式化する。
アクターベースとアクタークリティカルベースの2つのポリシーアルゴリズムが導入された。
先月末の天然ガス先物試験では、DRLモデルのシャープ比が買いと持ち株ベースラインと比較して83%高くなることが示されている。
論文 参考訳(メタデータ) (2023-08-10T17:21:12Z) - Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [51.3422222472898]
ニュース見出しを用いて,ChatGPTのような大規模言語モデル(LLM)の株価変動を予測する能力について述べる。
我々は,情報容量制約,過小反応,制限対アビタージュ,LLMを組み込んだ理論モデルを構築した。
論文 参考訳(メタデータ) (2023-04-15T19:22:37Z) - Factor Investing with a Deep Multi-Factor Model [123.52358449455231]
我々は、業界中立化と市場中立化モジュールを明確な財務見識をもって取り入れた、新しい深層多要素モデルを開発する。
実世界の株式市場データによるテストは、我々の深層多要素モデルの有効性を示している。
論文 参考訳(メタデータ) (2022-10-22T14:47:11Z) - Deep Learning Statistical Arbitrage [0.0]
本稿では,統計的仲裁のための統一的な概念枠組みを提案し,新しいディープラーニングソリューションを開発した。
我々は、条件付き遅延資産価格要素から残余ポートフォリオとして類似資産の仲裁ポートフォリオを構築する。
我々は、これらの残余ポートフォリオの時系列信号を、最も強力な機械学習時系列ソリューションの1つを用いて抽出する。
論文 参考訳(メタデータ) (2021-06-08T00:48:25Z) - Stock2Vec: A Hybrid Deep Learning Framework for Stock Market Prediction
with Representation Learning and Temporal Convolutional Network [71.25144476293507]
我々は、株式市場の日々の価格を予測するためのグローバルなハイブリッドディープラーニングフレームワークを開発することを提案した。
表現学習によって、私たちはStock2Vecという埋め込みを導きました。
我々のハイブリッドフレームワークは、両方の利点を統合し、いくつかの人気のあるベンチマークモデルよりも、株価予測タスクにおいてより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-09-29T22:54:30Z) - GA-MSSR: Genetic Algorithm Maximizing Sharpe and Sterling Ratio Method
for RoboTrading [0.4568777157687961]
外国為替は世界最大の金融市場である。
ほとんどの文献は、歴史的価格情報と技術指標を訓練に用いた。
この問題に対処するため,我々は,技術指標と取引規則から派生した取引規則の特徴を設計した。
論文 参考訳(メタデータ) (2020-08-16T05:33:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。