論文の概要: Mastering Pair Trading with Risk-Aware Recurrent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2304.00364v1
- Date: Sat, 1 Apr 2023 18:12:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 18:36:41.593662
- Title: Mastering Pair Trading with Risk-Aware Recurrent Reinforcement Learning
- Title(参考訳): リスクアウェアリカレント強化学習によるマスタリングペアトレーディング
- Authors: Weiguang Han, Jimin Huang, Qianqian Xie, Boyi Zhang, Yanzhao Lai, Min
Peng
- Abstract要約: CREDITは、人間専門家と同様、ペア取引における長期的な取引機会を活用することを学習できるリスク対応エージェントである。
CREDITは、状態に埋め込まれた時間的相関を完全に考慮する時間的注意機構とともに、双方向GRUを初めて適用した。
これは当社のエージェントが、高いリターンと損失の可能性のあるリスクの高いトレーディングを避けるために、堅牢なトレーディング優先でペアトレーディングをマスターするのに役立ちます。
- 参考スコア(独自算出の注目度): 10.566829415146426
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although pair trading is the simplest hedging strategy for an investor to
eliminate market risk, it is still a great challenge for reinforcement learning
(RL) methods to perform pair trading as human expertise. It requires RL methods
to make thousands of correct actions that nevertheless have no obvious
relations to the overall trading profit, and to reason over infinite states of
the time-varying market most of which have never appeared in history. However,
existing RL methods ignore the temporal connections between asset price
movements and the risk of the performed trading. These lead to frequent
tradings with high transaction costs and potential losses, which barely reach
the human expertise level of trading. Therefore, we introduce CREDIT, a
risk-aware agent capable of learning to exploit long-term trading opportunities
in pair trading similar to a human expert. CREDIT is the first to apply
bidirectional GRU along with the temporal attention mechanism to fully consider
the temporal correlations embedded in the states, which allows CREDIT to
capture long-term patterns of the price movements of two assets to earn higher
profit. We also design the risk-aware reward inspired by the economic theory,
that models both the profit and risk of the tradings during the trading period.
It helps our agent to master pair trading with a robust trading preference that
avoids risky trading with possible high returns and losses. Experiments show
that it outperforms existing reinforcement learning methods in pair trading and
achieves a significant profit over five years of U.S. stock data.
- Abstract(参考訳): ペアトレーディングは、市場リスクを排除するための投資家にとって最も単純なヘッジ戦略であるが、人間の専門知識としてペアトレーディングを行う強化学習(RL)手法には大きな課題である。
取引利益全体と明確な関係を持たない何千もの正しい行動をとるためにrl法が必要であり、そのほとんどが歴史に一度も現れていない市場における無限の状態を推論する必要がある。
しかし、既存のRL法は、資産価格の動きと取引のリスクの間の時間的つながりを無視している。
取引コストの高い取引と潜在的な損失を伴う頻繁な取引につながり、人間の専門知識の取引レベルにはほとんど達しない。
そこで我々は,人間専門家と同様のペア取引における長期取引機会を活用できるリスク認識エージェントであるCREDITを紹介する。
CREDITは、2つの資産の物価変動の長期的パターンを捉えて利益を得ることができるように、国家に埋め込まれた時間的相関を十分に考慮するための時間的注意機構とともに、初めて双方向GRUを適用する。
また、取引期間中の取引の利益とリスクの両方をモデル化した経済理論に触発されたリスク対応報酬も設計する。
当社のエージェントは、高リターンと損失の可能性を伴うリスクの高い取引を回避し、強固な取引選好でペア取引をマスターする上で役立ちます。
実験では、既存の強化学習手法をペアトレーディングで上回り、5年間の米国株データで大きな利益を得ている。
関連論文リスト
- When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.19252983108372]
LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。
StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。
AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文 参考訳(メタデータ) (2024-07-15T06:49:30Z) - MacroHFT: Memory Augmented Context-aware Reinforcement Learning On High Frequency Trading [20.3106468936159]
強化学習(RL)は、高周波取引(HFT)のもう一つの魅力あるアプローチとなっている。
我々は,新しいメモリ拡張コンテキスト認識強化学習手法であるOn HFT, empha.k. MacroHFTを提案する。
マイクロレベルのトレーディングタスクにおいて,MacroHFTは最先端のパフォーマンスを実現することができることを示す。
論文 参考訳(メタデータ) (2024-06-20T17:48:24Z) - A Deep Reinforcement Learning Approach for Trading Optimization in the Forex Market with Multi-Agent Asynchronous Distribution [0.0]
この研究は、最先端の非同期アドバンテージ・アクター・クリティカル(A3C)アルゴリズムを用いたマルチエージェント(MA)RLフレームワークの適用を先導する。
ロックとロックなしの2つの異なるA3Cが提案され、単一通貨とマルチ通貨で訓練された。
以上の結果から,両モデルが近似政策最適化モデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-05-30T12:07:08Z) - Combining Deep Learning on Order Books with Reinforcement Learning for
Profitable Trading [0.0]
本研究は,注文フローを用いた複数地平線におけるリターン予測と,5つの金融機器を対象とした3つの時間差不均衡学習モデルを訓練することに焦点を当てる。
この結果は潜在的な可能性を証明しているが、小売取引コスト、滑り込み、スプレッド・揺らぎを完全に処理するためには、一貫した黒字取引のためのさらなる最小限の修正が必要である。
論文 参考訳(メタデータ) (2023-10-24T15:58:58Z) - Can Perturbations Help Reduce Investment Risks? Risk-Aware Stock
Recommendation via Split Variational Adversarial Training [44.7991257631318]
本稿では,リスクを意識したストックレコメンデーションのための新しいSVAT法を提案する。
株式レコメンデーションモデルのボラティリティを下げることで、SVATは投資リスクを効果的に低減し、リスク調整利益の点で最先端のベースラインを30%以上上回ります。
論文 参考訳(メタデータ) (2023-04-20T12:10:12Z) - Factor Investing with a Deep Multi-Factor Model [123.52358449455231]
我々は、業界中立化と市場中立化モジュールを明確な財務見識をもって取り入れた、新しい深層多要素モデルを開発する。
実世界の株式市場データによるテストは、我々の深層多要素モデルの有効性を示している。
論文 参考訳(メタデータ) (2022-10-22T14:47:11Z) - DeepScalper: A Risk-Aware Reinforcement Learning Framework to Capture
Fleeting Intraday Trading Opportunities [33.28409845878758]
日内取引のための深層強化学習フレームワークであるDeepScalperを提案する。
我々は、DeepScalperが4つの財務基準において、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2021-12-15T15:24:02Z) - Deep Q-Learning Market Makers in a Multi-Agent Simulated Stock Market [58.720142291102135]
本稿では,エージェント・ベースの観点から,これらのマーケット・メーカーの戦略に関する研究に焦点をあてる。
模擬株式市場における知的市場マーカー作成のための強化学習(Reinforcement Learning, RL)の適用を提案する。
論文 参考訳(メタデータ) (2021-12-08T14:55:21Z) - Deep Learning Statistical Arbitrage [0.0]
本稿では,統計的仲裁のための統一的な概念枠組みを提案し,新しいディープラーニングソリューションを開発した。
我々は、条件付き遅延資産価格要素から残余ポートフォリオとして類似資産の仲裁ポートフォリオを構築する。
我々は、これらの残余ポートフォリオの時系列信号を、最も強力な機械学習時系列ソリューションの1つを用いて抽出する。
論文 参考訳(メタデータ) (2021-06-08T00:48:25Z) - Taking Over the Stock Market: Adversarial Perturbations Against
Algorithmic Traders [47.32228513808444]
本稿では,敵対的学習手法を用いて,攻撃者がアルゴリズム取引システムに影響を与える現実的なシナリオを提案する。
入力ストリームに追加されると、我々の摂動は将来目に見えないデータポイントのトレーディングアルゴリズムを騙すことができることを示す。
論文 参考訳(メタデータ) (2020-10-19T06:28:05Z) - A Deep Reinforcement Learning Framework for Continuous Intraday Market
Bidding [69.37299910149981]
再生可能エネルギー源統合の成功の鍵となる要素は、エネルギー貯蔵の利用である。
欧州の継続的な日内市場におけるエネルギー貯蔵の戦略的関与をモデル化するための新しい枠組みを提案する。
本アルゴリズムの分散バージョンは, サンプル効率のため, この問題を解決するために選択される。
その結果, エージェントは, ベンチマーク戦略よりも平均的収益率の高い政策に収束することが示唆された。
論文 参考訳(メタデータ) (2020-04-13T13:50:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。