論文の概要: Reinforcement Learning for Financial Index Tracking
- arxiv url: http://arxiv.org/abs/2308.02820v2
- Date: Sun, 17 Nov 2024 12:53:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:26:49.479067
- Title: Reinforcement Learning for Financial Index Tracking
- Title(参考訳): 金融指標追跡のための強化学習
- Authors: Xianhua Peng, Chenyin Gong, Xue Dong He,
- Abstract要約: 本稿では、回帰ベースのトラッキングエラーと値ベースのトラッキングエラーの両方の下で、金融指標追跡問題の最初の離散時間無限水平動的定式化を提案する。
提案手法は, 追跡精度でベンチマーク手法を上回り, キャッシュ引き出し戦略により余剰利益を得る可能性がある。
- 参考スコア(独自算出の注目度): 2.048226951354646
- License:
- Abstract: We propose the first discrete-time infinite-horizon dynamic formulation of the financial index tracking problem under both return-based tracking error and value-based tracking error. The formulation overcomes the limitations of existing models by incorporating the intertemporal dynamics of market information variables not limited to prices, allowing exact calculation of transaction costs, accounting for the tradeoff between overall tracking error and transaction costs, allowing effective use of data in a long time period, etc. The formulation also allows novel decision variables of cash injection or withdraw. We propose to solve the portfolio rebalancing equation using a Banach fixed point iteration, which allows to accurately calculate the transaction costs specified as nonlinear functions of trading volumes in practice. We propose an extension of deep reinforcement learning (RL) method to solve the dynamic formulation. Our RL method resolves the issue of data limitation resulting from the availability of a single sample path of financial data by a novel training scheme. A comprehensive empirical study based on a 17-year-long testing set demonstrates that the proposed method outperforms a benchmark method in terms of tracking accuracy and has the potential for earning extra profit through cash withdraw strategy.
- Abstract(参考訳): 本稿では、回帰ベースのトラッキングエラーと値ベースのトラッキングエラーの両方の下で、金融指標追跡問題の最初の離散時間無限水平動的定式化を提案する。
この定式化は、価格に制限されない市場情報変数の時間的ダイナミクスを取り入れ、取引コストの正確な計算を可能にし、全体的な追跡エラーと取引コストのトレードオフを考慮し、長期間のデータ有効利用を可能にし、既存のモデルの限界を克服する。
この定式化により、キャッシュインジェクションの新規な決定変数や取り下げが可能になる。
本稿では,バナッハ固定点反復法を用いて,取引ボリュームの非線形関数として規定される取引コストを正確に計算できるポートフォリオ再バランス方程式を提案する。
動的定式化の解法として深部強化学習法(RL法)の拡張を提案する。
我々のRL法は、新たなトレーニング手法により、財務データの単一サンプルパスが利用可能になったことにより、データ制限の問題を解消する。
17年にわたるテストセットに基づく総合的な実証研究により,提案手法は精度の追跡においてベンチマーク法よりも優れ,キャッシュ引き出し戦略により余分な利益を得る可能性が示された。
関連論文リスト
- Improving Realized LGD Approximation: A Novel Framework with XGBoost for Handling Missing Cash-Flow Data [0.0]
キャッシュフローデータに依存しないXGBoostモデルを構築し,LGD推定の精度を向上させる。
我々の研究の新たな側面は、デルタの卓越したアプローチの詳細な探索と、キャッシュフローデータへの限られたアクセス条件に対処するための方法論である。
論文 参考訳(メタデータ) (2024-06-25T06:41:09Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Generating drawdown-realistic financial price paths using path
signatures [0.0]
本稿では,金融価格データのシーケンスを定量的に近似したドローダウンでシミュレーションするための,新しい生成機械学習手法を提案する。
我々は、変分自己エンコーダ生成モデルと縮小再構成損失関数を組み合わせた非自明なモンテカルロアプローチを提唱する。
我々は、混合株式、債券、不動産、商品ポートフォリオに関する数値実験で締めくくった。
論文 参考訳(メタデータ) (2023-09-08T10:06:40Z) - An Offline Learning Approach to Propagator Models [3.1755820123640612]
まず、静的データセットから未知の価格影響カーネルを推定するエージェントに対して、オフラインで学習する問題を考察する。
本稿では,価格トラジェクトリ,トレーディング信号,メタオーダーを含むデータセットからプロパゲータを非パラメトリックに推定する手法を提案する。
提案手法では,提案手法を純粋に活用することで,実行コストを最小化しようとするトレーダーが準最適に遭遇することを示す。
論文 参考訳(メタデータ) (2023-09-06T13:36:43Z) - Diffusion Variational Autoencoder for Tackling Stochasticity in
Multi-Step Regression Stock Price Prediction [54.21695754082441]
長期的地平線上での多段階の株価予測は、ボラティリティの予測に不可欠である。
多段階の株価予測に対する現在の解決策は、主に単一段階の分類に基づく予測のために設計されている。
深層階層型変分オートコーダ(VAE)と拡散確率的手法を組み合わせてセック2seqの株価予測を行う。
本モデルでは, 予測精度と分散性の観点から, 最先端の解よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-18T16:21:15Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z) - Interpretable ML-driven Strategy for Automated Trading Pattern
Extraction [2.7910505923792646]
金融時系列分析のためのボリュームベースデータ前処理手法を提案する。
手法の性能を評価するために統計的手法を用いる。
提案手法により,金融時系列パターンの分類を成功させることができた。
論文 参考訳(メタデータ) (2021-03-23T09:55:46Z) - Deep Hedging: Learning Risk-Neutral Implied Volatility Dynamics [0.0]
シミュレーションスポットとオプション価格の経路に対するリスクニュートラル測度学習のための数値的効率的アプローチ
市場ダイナミクスは、リスク中立的措置に従う場合に限り、取引コストがなければ「統計的な仲裁」ができないことを示している。
論文 参考訳(メタデータ) (2021-03-22T15:38:25Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - Upper Confidence Primal-Dual Reinforcement Learning for CMDP with
Adversarial Loss [145.54544979467872]
マルコフ決定過程(CMDP)に対するオンライン学習の検討
本稿では,遷移モデルから標本化した軌跡のみを必要とする,新しいEmphupper confidence primal-dualアルゴリズムを提案する。
我々の分析では、ラグランジュ乗算過程の新たな高確率ドリフト解析を、高信頼強化学習の記念後悔解析に組み入れている。
論文 参考訳(メタデータ) (2020-03-02T05:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。