論文の概要: Robust machine learning pipelines for trading market-neutral stock
portfolios
- arxiv url: http://arxiv.org/abs/2301.00790v1
- Date: Fri, 30 Dec 2022 17:19:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 16:27:33.924463
- Title: Robust machine learning pipelines for trading market-neutral stock
portfolios
- Title(参考訳): 市場中立株ポートフォリオ取引のためのロバスト機械学習パイプライン
- Authors: Thomas Wong and Mauricio Barahona
- Abstract要約: 市場中立株ポートフォリオを取引するための機械学習パイプラインを提案する。
グラディエントブースティング決定木(GBDT)やニューラルネットワークなど,さまざまな機械学習モデルを評価する。
オンライン学習技術は、予測後処理に使用して結果を向上することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The application of deep learning algorithms to financial data is difficult
due to heavy non-stationarities which can lead to over-fitted models that
underperform under regime changes. Using the Numerai tournament data set as a
motivating example, we propose a machine learning pipeline for trading
market-neutral stock portfolios based on tabular data which is robust under
changes in market conditions. We evaluate various machine-learning models,
including Gradient Boosting Decision Trees (GBDTs) and Neural Networks with and
without simple feature engineering, as the building blocks for the pipeline. We
find that GBDT models with dropout display high performance, robustness and
generalisability with relatively low complexity and reduced computational cost.
We then show that online learning techniques can be used in post-prediction
processing to enhance the results. In particular, dynamic feature
neutralisation, an efficient procedure that requires no retraining of models
and can be applied post-prediction to any machine learning model, improves
robustness by reducing drawdown in volatile market conditions. Furthermore, we
demonstrate that the creation of model ensembles through dynamic model
selection based on recent model performance leads to improved performance over
baseline by improving the Sharpe and Calmar ratios. We also evaluate the
robustness of our pipeline across different data splits and random seeds with
good reproducibility of results.
- Abstract(参考訳): 深層学習アルゴリズムの金融データへの適用は、非定常性が高いため、制度変更時に過度に適合するモデルに繋がる可能性があるため困難である。
本研究では,Numeraiのトーナメントデータセットをモチベーションの例として用いて,市場環境の変化に頑健な表型データに基づいて,市場中立の株式ポートフォリオを取引するための機械学習パイプラインを提案する。
パイプライン構築ブロックとして,グラディエントブースティング決定木(GBDT)やニューラルネットワークなど,さまざまな機械学習モデルを評価した。
ドロップアウトディスプレイを用いたGBDTモデルは, 比較的低複雑性で, 計算コストの低減が図られている。
次に, オンライン学習手法が予測後処理に利用され, 結果が向上することを示す。
特に、動的特徴中立化(Dynamic feature neutralization)は、モデルの再トレーニングを必要とせず、任意の機械学習モデルに予測後に適用できる効率的な手順であり、揮発性市場条件の低下を減らすことで堅牢性を改善する。
さらに,最近のモデル性能に基づく動的モデル選択によるモデルアンサンブルの作成は,シャープと静寂の比率を改善することにより,ベースラインよりもパフォーマンスが向上することを示す。
また,異なるデータ分割とランダム種子間のパイプラインのロバスト性を評価し,再現性も良好に評価した。
関連論文リスト
- Supervised Score-Based Modeling by Gradient Boosting [49.556736252628745]
本稿では,スコアマッチングを組み合わせた勾配向上アルゴリズムとして,SSM(Supervised Score-based Model)を提案する。
推測時間と予測精度のバランスをとるため,SSMの学習とサンプリングに関する理論的解析を行った。
我々のモデルは、精度と推測時間の両方で既存のモデルより優れています。
論文 参考訳(メタデータ) (2024-11-02T07:06:53Z) - Graph-enabled Reinforcement Learning for Time Series Forecasting with
Adaptive Intelligence [11.249626785206003]
グラフニューラルネットワーク(GNN)と強化学習(RL)を用いたモニタリングによる時系列データの予測手法を提案する。
GNNは、データのグラフ構造をモデルに明示的に組み込むことができ、時間的依存関係をより自然な方法でキャプチャすることができる。
このアプローチは、医療、交通、天気予報など、複雑な時間構造におけるより正確な予測を可能にする。
論文 参考訳(メタデータ) (2023-09-18T22:25:12Z) - SHAPNN: Shapley Value Regularized Tabular Neural Network [4.587122314291091]
本稿では,教師あり学習のための新しい深層データモデリングアーキテクチャであるSHAPNNを紹介する。
我々のニューラルネットワークは、標準的な後方伝播最適化手法を用いて訓練され、リアルタイムに推定されたShapley値で正規化される。
我々は,これらの手法を公開データセット上で評価し,最先端のディープニューラルネットワークモデルと比較した。
論文 参考訳(メタデータ) (2023-09-15T22:45:05Z) - Kalman Filter for Online Classification of Non-Stationary Data [101.26838049872651]
オンライン連続学習(OCL)では、学習システムはデータのストリームを受け取り、予測とトレーニングの手順を順次実行する。
本稿では,線形予測量に対するニューラル表現と状態空間モデルを用いた確率ベイズオンライン学習モデルを提案する。
多クラス分類の実験では、モデルの予測能力と非定常性を捉える柔軟性を示す。
論文 参考訳(メタデータ) (2023-06-14T11:41:42Z) - Transfer Learning in Deep Learning Models for Building Load Forecasting:
Case of Limited Data [0.0]
本稿では,この問題を克服し,ディープラーニングモデルの性能を向上させるためのビルディング・ツー・ビルディング・トランスファー・ラーニング・フレームワークを提案する。
提案手法は,スクラッチからトレーニングを行う従来のディープラーニングと比較して,予測精度を56.8%向上させた。
論文 参考訳(メタデータ) (2023-01-25T16:05:47Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Churn Reduction via Distillation [54.5952282395487]
本研究は, 基礎モデルを教師として用いた蒸留によるトレーニングと, 予測的チャーンに対する明示的な制約によるトレーニングとの等価性を示す。
次に, 蒸留が近年の多くのベースラインに対する低チャーン訓練に有効であることを示す。
論文 参考訳(メタデータ) (2021-06-04T18:03:31Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - Reinforcement Learning based dynamic weighing of Ensemble Models for
Time Series Forecasting [0.8399688944263843]
データモデリングのために選択されたモデルが(線形/非線形、静的/動的)異なるモデルと独立(最小相関)モデルである場合、予測の精度が向上することが知られている。
アンサンブルモデルを重み付けするために文献で提案された様々なアプローチは、静的な重みセットを使用する。
この問題に対処するため、Reinforcement Learning (RL)アプローチでは、各モデルの重み付けを異なるタイミングで動的に割り当て、更新する。
論文 参考訳(メタデータ) (2020-08-20T10:40:42Z) - Extrapolation for Large-batch Training in Deep Learning [72.61259487233214]
我々は、バリエーションのホストが、我々が提案する統一されたフレームワークでカバー可能であることを示す。
本稿では,この手法の収束性を証明し,ResNet,LSTM,Transformer上での経験的性能を厳格に評価する。
論文 参考訳(メタデータ) (2020-06-10T08:22:41Z) - Online Tensor-Based Learning for Multi-Way Data [1.0953917735844645]
オンラインの$CANDECOMP/PARAFAC$分解のために、新しい効率的なテンソルベースの特徴抽出法NeSGDが提案されている。
その結果,提案手法は分類誤り率を大幅に改善し,時間とともに正のデータ分布の変化を同化することができ,全てのケーススタディにおいて高い予測精度を維持した。
論文 参考訳(メタデータ) (2020-03-10T02:04:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。