論文の概要: Reinforcement Learning for Systematic FX Trading
- arxiv url: http://arxiv.org/abs/2110.04745v1
- Date: Sun, 10 Oct 2021 09:44:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-16 17:05:18.295888
- Title: Reinforcement Learning for Systematic FX Trading
- Title(参考訳): 系統的FXトレーディングのための強化学習
- Authors: Gabriel Borrageiro and Nick Firoozye and Paolo Barucca
- Abstract要約: 我々は、主要なキャッシュペアについて詳細な実験を行い、取引と資金調達のコストを正確に説明します。
こうした利益と損失の源泉は、通貨市場で発生した価格動向を含め、当社の継続的な強化学習者に提供されています。
取引コストが統計上最も高いのは、午後5時(日本時間午前5時)の取引終了時にモデルに取引を強制したにもかかわらず。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We conduct a detailed experiment on major cash fx pairs, accurately
accounting for transaction and funding costs. These sources of profit and loss,
including the price trends that occur in the currency markets, are made
available to our recurrent reinforcement learner via a quadratic utility, which
learns to target a position directly. We improve upon earlier work, by casting
the problem of learning to target a risk position, in an online learning
context. This online learning occurs sequentially in time, but also in the form
of transfer learning. We transfer the output of radial basis function hidden
processing units, whose means, covariances and overall size are determined by
Gaussian mixture models, to the recurrent reinforcement learner and baseline
momentum trader. Thus the intrinsic nature of the feature space is learnt and
made available to the upstream models. The recurrent reinforcement learning
trader achieves an annualised portfolio information ratio of 0.52 with compound
return of 9.3%, net of execution and funding cost, over a 7 year test set. This
is despite forcing the model to trade at the close of the trading day 5pm EST,
when trading costs are statistically the most expensive. These results are
comparable with the momentum baseline trader, reflecting the low interest
differential environment since the the 2008 financial crisis, and very obvious
currency trends since then. The recurrent reinforcement learner does
nevertheless maintain an important advantage, in that the model's weights can
be adapted to reflect the different sources of profit and loss variation. This
is demonstrated visually by a USDRUB trading agent, who learns to target
different positions, that reflect trading in the absence or presence of cost.
- Abstract(参考訳): 取引コストと資金コストを正確に計算し,主要なキャッシュfxペアについて詳細な実験を行った。
通貨市場で発生する価格動向を含むこれらの利益と損失の源泉は、二次的ユーティリティを通じて、我々の再帰的な強化学習者に提供され、位置を直接目標にすることを学ぶ。
我々は,オンライン学習の文脈において,リスク位置を目標とする学習問題をキャストすることで,初期の作業を改善する。
このオンライン学習は、時間とともに順次行われるが、転送学習の形でも行われる。
我々は、ガウス混合モデルにより、その手段、共分散および全体サイズが決定される放射状基底関数隠蔽処理ユニットの出力を、繰り返し強化学習者およびベースライン運動量トレーダーに転送する。
したがって、特徴空間の本質的な性質を学習し、上流モデルで利用できるようにする。
リカレント強化学習トレーダーは、7年間の試験セットで、年間ポートフォリオ情報比0.52、複合リターン9.3%、実行ネットおよび資金調達コストを達成している。
これは、取引コストが統計的に最も高い場合、取引日の午後5時にモデルに取引を強制したにもかかわらずである。
これらの結果は、2008年の金融危機以来の低金利差環境とそれ以来の非常に明白な通貨トレンドを反映して、モーメントベースライントレーダーに匹敵する。
繰り返し強化学習者は、利益と損失の変化の異なる源を反映するようにモデルの重みを適応できるという点において、重要な優位性を維持している。
これは、異なるポジションを狙うことを学ぶusdrubのトレーディングエージェントによって視覚的に示され、コストの欠如や存在をトレーディングを反映している。
関連論文リスト
- When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.19252983108372]
LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。
StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。
AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文 参考訳(メタデータ) (2024-07-15T06:49:30Z) - A Bargaining-based Approach for Feature Trading in Vertical Federated
Learning [54.51890573369637]
本稿では,垂直的フェデレートラーニング(VFL)において,経済的に効率的な取引を促進するための交渉型特徴取引手法を提案する。
当社のモデルでは,収益ベース最適化の目的を考慮し,パフォーマンスゲインベースの価格設定を取り入れている。
論文 参考訳(メタデータ) (2024-02-23T10:21:07Z) - An Auction-based Marketplace for Model Trading in Federated Learning [54.79736037670377]
フェデレートラーニング(FL)は、局所的な分散データを用いたトレーニングモデルにおいて、その効果がますます認識されている。
FLはモデルのマーケットプレースであり、顧客は買い手と売り手の両方として振る舞う。
本稿では,性能向上に基づく適切な価格設定を実現するため,オークションベースのソリューションを提案する。
論文 参考訳(メタデータ) (2024-02-02T07:25:53Z) - Combining Deep Learning on Order Books with Reinforcement Learning for
Profitable Trading [0.0]
本研究は,注文フローを用いた複数地平線におけるリターン予測と,5つの金融機器を対象とした3つの時間差不均衡学習モデルを訓練することに焦点を当てる。
この結果は潜在的な可能性を証明しているが、小売取引コスト、滑り込み、スプレッド・揺らぎを完全に処理するためには、一貫した黒字取引のためのさらなる最小限の修正が必要である。
論文 参考訳(メタデータ) (2023-10-24T15:58:58Z) - NoxTrader: LSTM-Based Stock Return Momentum Prediction for Quantitative
Trading [0.0]
NoxTraderはポートフォリオの構築と取引実行のために設計された洗練されたシステムである。
NoxTraderの基本的な学習プロセスは、歴史的取引データから得られた貴重な洞察の同化に根ざしている。
厳密な特徴工学と予測対象の選択により,0.65から0.75の範囲の顕著な相関範囲で予測データを生成することができる。
論文 参考訳(メタデータ) (2023-10-01T17:53:23Z) - Data Cross-Segmentation for Improved Generalization in Reinforcement
Learning Based Algorithmic Trading [5.75899596101548]
本稿では,学習した予測モデルからの信号に基づいて処理を行う強化学習(RL)アルゴリズムを提案する。
われわれのアルゴリズムは、ブルサ・マレーシアの20年以上のエクイティデータに基づいてテストしている。
論文 参考訳(メタデータ) (2023-07-18T16:00:02Z) - MERMAIDE: Learning to Align Learners using Model-Based Meta-Learning [62.065503126104126]
本研究では,先見のつかない学習エージェントの報酬を効率よく効果的に介入し,望ましい結果を導き出す方法について検討する。
これはオークションや課税のような現実世界の多くの設定に関係しており、プリンシパルは学習行動や実際の人々の報酬を知らないかもしれない。
モデルに基づくメタ学習フレームワークであるMERMAIDEを導入し,配布外エージェントに迅速に適応できるプリンシパルを訓練する。
論文 参考訳(メタデータ) (2023-04-10T15:44:50Z) - Learning to Liquidate Forex: Optimal Stopping via Adaptive Top-K
Regression [19.942711817396734]
我々は、外国通貨(FC)で収益を上げ、国内通貨(HC)で経費を計上する企業のために行動する取引業者を学習することを検討する。
エージェントの目標は、トレーディングエピソードの終盤において、トレーディングエピソードの各ステップでFCを保持または販売することを決定したことにより、期待されるHCを最大化することである。
今後,すべてのFXレートを予測せずに,トップKのFXレートを予測できる新しい教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2022-02-25T09:33:10Z) - Deep Learning Statistical Arbitrage [0.0]
本稿では,統計的仲裁のための統一的な概念枠組みを提案し,新しいディープラーニングソリューションを開発した。
我々は、条件付き遅延資産価格要素から残余ポートフォリオとして類似資産の仲裁ポートフォリオを構築する。
我々は、これらの残余ポートフォリオの時系列信号を、最も強力な機械学習時系列ソリューションの1つを用いて抽出する。
論文 参考訳(メタデータ) (2021-06-08T00:48:25Z) - Taking Over the Stock Market: Adversarial Perturbations Against
Algorithmic Traders [47.32228513808444]
本稿では,敵対的学習手法を用いて,攻撃者がアルゴリズム取引システムに影響を与える現実的なシナリオを提案する。
入力ストリームに追加されると、我々の摂動は将来目に見えないデータポイントのトレーディングアルゴリズムを騙すことができることを示す。
論文 参考訳(メタデータ) (2020-10-19T06:28:05Z) - Precise Tradeoffs in Adversarial Training for Linear Regression [55.764306209771405]
本稿では,ガウス的特徴を伴う線形回帰の文脈における対人訓練の役割を,正確かつ包括的に理解する。
我々は,同時代のミニマックス対逆訓練手法によって達成された標準/ロバスト精度とそれに対応するトレードオフを正確に特徴づける。
逆行訓練アルゴリズムの理論は、様々な要因(トレーニングデータのサイズや品質、モデルの過度化など)がこれらの2つの競合するアキュラシー間のトレードオフにどのように影響するかを厳密に研究する上で役立ちます。
論文 参考訳(メタデータ) (2020-02-24T19:01:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。