論文の概要: Reinforcement Learning with Expert Trajectory For Quantitative Trading
- arxiv url: http://arxiv.org/abs/2105.03844v1
- Date: Sun, 9 May 2021 05:49:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 15:10:59.067487
- Title: Reinforcement Learning with Expert Trajectory For Quantitative Trading
- Title(参考訳): 量的トレーディングのためのエキスパート軌道を用いた強化学習
- Authors: Sihang Chen, Weiqi Luo and Chao Yu
- Abstract要約: 価格予測問題をマルコフ決定プロセス(MDP)としてモデル化し、エキスパート軌道による強化学習により最適化します。
我々は、MDPの状態を記述するための既存の手法において、価格、ボリューム、およびいくつかの技術的要因の代わりに、100以上の短期的アルファ因子を用いる。
IF(CSI 300)およびIC(CSI 500)を含む中国の株価指数先物に関する実験的評価
- 参考スコア(独自算出の注目度): 11.460285913081346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, quantitative investment methods combined with artificial
intelligence have attracted more and more attention from investors and
researchers. Existing related methods based on the supervised learning are not
very suitable for learning problems with long-term goals and delayed rewards in
real futures trading. In this paper, therefore, we model the price prediction
problem as a Markov decision process (MDP), and optimize it by reinforcement
learning with expert trajectory. In the proposed method, we employ more than
100 short-term alpha factors instead of price, volume and several technical
factors in used existing methods to describe the states of MDP. Furthermore,
unlike DQN (deep Q-learning) and BC (behavior cloning) in related methods, we
introduce expert experience in training stage, and consider both the
expert-environment interaction and the agent-environment interaction to design
the temporal difference error so that the agents are more adaptable for
inevitable noise in financial data. Experimental results evaluated on share
price index futures in China, including IF (CSI 300) and IC (CSI 500), show
that the advantages of the proposed method compared with three typical
technical analysis and two deep leaning based methods.
- Abstract(参考訳): 近年、定量的な投資手法と人工知能が組み合わさって、投資家や研究者の注目を集めている。
教師付き学習に基づく既存の手法は、将来的な取引における長期的な目標と遅延報酬の学習にはあまり適していない。
そこで本稿では,価格予測問題をマルコフ決定過程(MDP)としてモデル化し,専門家軌道による強化学習により最適化する。
提案手法では,MDPの状態を記述するための既存手法において,価格・ボリューム・技術的要因の代わりに,100以上の短期的アルファ因子を用いる。
さらに, DQN (Deep Q-learning) やBC (Behavior cloning) と異なり, 訓練段階のエキスパート体験を導入し, 専門家-環境相互作用とエージェント-環境相互作用の両方を考慮し, 時間差誤差を設計し, エージェントが金融データの避けられないノイズに適応できるようにした。
IF (CSI 300) とIC (CSI 500) を含む中国における株価指数の将来を実験的に評価した結果, 提案手法の利点が3つの典型的な技術分析と2つの深い傾きに基づく手法と比較された。
関連論文リスト
- MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.20845457594977]
大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。
本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。
メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文 参考訳(メタデータ) (2024-06-20T03:50:23Z) - A quantitative fusion strategy of stock picking and timing based on
Particle Swarm Optimized-Back Propagation Neural Network and Multivariate
Gaussian-Hidden Markov Model [0.0]
本研究は,ストックタイミングとピック戦略を組み合わせた定量的核融合モデルを提案する。
我々はMGHMMが訓練した株と株式市場の状態に基づいて、予測と取引を行う。
本論文で提示する株式の選定とタイミングを取り入れた融合戦略は、金融分析の革新的な技術である。
論文 参考訳(メタデータ) (2023-12-10T04:33:59Z) - Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [51.3422222472898]
ニュース見出しを用いて,ChatGPTのような大規模言語モデル(LLM)の株価変動を予測する能力について述べる。
我々は,情報容量制約,過小反応,制限対アビタージュ,LLMを組み込んだ理論モデルを構築した。
論文 参考訳(メタデータ) (2023-04-15T19:22:37Z) - Factor Investing with a Deep Multi-Factor Model [123.52358449455231]
我々は、業界中立化と市場中立化モジュールを明確な財務見識をもって取り入れた、新しい深層多要素モデルを開発する。
実世界の株式市場データによるテストは、我々の深層多要素モデルの有効性を示している。
論文 参考訳(メタデータ) (2022-10-22T14:47:11Z) - Uncertainty-Driven Action Quality Assessment [67.20617610820857]
本稿では,複数の判定スコアの多様性を捉えるために,不確実性駆動型AQA (UD-AQA) という新しい確率モデルを提案する。
我々は,AQA回帰損失の再重み付けに使用される各予測の不確かさを推定する。
提案手法は,オリンピックイベントMTL-AQAとFineDivingの3つのベンチマークと,手術スキルJIGSAWSデータセットの3つのベンチマークで比較結果を得た。
論文 参考訳(メタデータ) (2022-07-29T07:21:15Z) - Quantitative Stock Investment by Routing Uncertainty-Aware Trading
Experts: A Multi-Task Learning Approach [29.706515133374193]
既存のディープラーニング手法はランダムなシードやネットワークルータに敏感であることを示す。
本稿では,成功した取引会社の効果的なボトムアップトレーディング戦略設計ワークフローを模倣する,量的投資のための新しい2段階混成(MoE)フレームワークを提案する。
AlphaMixは4つの財務基準において、最先端のベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2022-06-07T08:58:00Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z) - Deep Portfolio Optimization via Distributional Prediction of Residual
Factors [3.9189409002585562]
そこで本稿では,残余要因と呼ばれる金融量分布の予測に基づくポートフォリオ構築手法を提案する。
本手法が米国および日本の株式市場データに有効であることを実証する。
論文 参考訳(メタデータ) (2020-12-14T04:09:52Z) - Cross Learning in Deep Q-Networks [82.20059754270302]
本稿では、値に基づく強化学習手法において、よく知られた過大評価問題を緩和することを目的とした、新しいクロスQ-ラーニングアルゴリズムを提案する。
本アルゴリズムは,並列モデルの集合を維持し,ランダムに選択されたネットワークに基づいてQ値を算出することによって,二重Q-ラーニングに基づいて構築する。
論文 参考訳(メタデータ) (2020-09-29T04:58:17Z) - Bid Prediction in Repeated Auctions with Learning [30.07778295477907]
本稿では,メインストリームの検索オークションマーケットプレースからのデータセットを用いて,繰り返しオークションにおける入札予測の問題を検討する。
提案手法は,非regret型エコノメトリを用いて入札予測を行い,ユーティリティ関数に関する非regret学習者としてプレーヤをモデル化する。
この手法は,最先端の時系列機械学習手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2020-07-26T18:14:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。