論文の概要: Feature Selection with Annealing for Forecasting Financial Time Series
- arxiv url: http://arxiv.org/abs/2303.02223v3
- Date: Fri, 23 Feb 2024 13:16:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 18:34:51.453842
- Title: Feature Selection with Annealing for Forecasting Financial Time Series
- Title(参考訳): 金融時系列予測のためのアニーリングによる特徴選択
- Authors: Hakan Pabuccu, Adrian Barbu
- Abstract要約: 本研究では,機械学習(ML)モデルを用いた戦術的入力出力特徴マッピング技術に基づいて,財務時系列を総合的に予測する手法を提案する。
実験の結果,FSAアルゴリズムは問題の種類に関わらず,MLモデルの性能を向上することが示された。
- 参考スコア(独自算出の注目度): 2.44755919161855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stock market and cryptocurrency forecasting is very important to investors as
they aspire to achieve even the slightest improvement to their buy or hold
strategies so that they may increase profitability. However, obtaining accurate
and reliable predictions is challenging, noting that accuracy does not equate
to reliability, especially when financial time-series forecasting is applied
owing to its complex and chaotic tendencies. To mitigate this complexity, this
study provides a comprehensive method for forecasting financial time series
based on tactical input output feature mapping techniques using machine
learning (ML) models. During the prediction process, selecting the relevant
indicators is vital to obtaining the desired results. In the financial field,
limited attention has been paid to this problem with ML solutions. We
investigate the use of feature selection with annealing (FSA) for the first
time in this field, and we apply the least absolute shrinkage and selection
operator (Lasso) method to select the features from more than 1,000 candidates
obtained from 26 technical classifiers with different periods and lags. Boruta
(BOR) feature selection, a wrapper method, is used as a baseline for
comparison. Logistic regression (LR), extreme gradient boosting (XGBoost), and
long short-term memory (LSTM) are then applied to the selected features for
forecasting purposes using 10 different financial datasets containing
cryptocurrencies and stocks. The dependent variables consisted of daily
logarithmic returns and trends. The mean-squared error for regression, area
under the receiver operating characteristic curve, and classification accuracy
were used to evaluate model performance, and the statistical significance of
the forecasting results was tested using paired t-tests. Experiments indicate
that the FSA algorithm increased the performance of ML models, regardless of
problem type.
- Abstract(参考訳): 株式市場と暗号通貨の予測は投資家にとって非常に重要であり、彼らが利益率を上げるために購入や持株戦略のわずかな改善をも達成したいと考えているからだ。
しかし、正確で信頼性の高い予測を得ることは困難であり、特に金融時系列予測が複雑でカオス的な傾向から適用された場合、正確さは信頼性に等しいものではない。
この複雑さを軽減するために,機械学習(ml)モデルを用いた戦術的入力出力特徴マッピング手法に基づく金融時系列予測手法を提案する。
予測過程において、所望の結果を得るには、関連する指標を選択することが不可欠である。
金融分野では、MLソリューションでこの問題に限定的な注意が払われている。
本研究では, この分野で初めてアニーリング(FSA)を用いた特徴選択法について検討し, 時間と遅延の異なる26の技術的分類器から得られた1,000以上の候補の中から, 最小限の収縮・選択演算子(Lasso)法を適用した。
Boruta(BOR)の特徴選択(ラッパーメソッド)は、比較のベースラインとして使用される。
次に、暗号通貨と株式を含む10の金融データセットを用いて、ロジスティック回帰(LR)、極勾配増強(XGBoost)、長短期記憶(LSTM)を選択して予測する。
依存変数は日次対数回帰と傾向から成っていた。
モデルの性能評価には回帰平均二乗誤差, 動作特性曲線下領域, 分類精度を用い, 予測結果の統計的意義をペアtテストを用いて検証した。
実験の結果、fsaアルゴリズムは問題の種類に関係なくmlモデルの性能を高めた。
関連論文リスト
- F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Enhancing Mean-Reverting Time Series Prediction with Gaussian Processes:
Functional and Augmented Data Structures in Financial Forecasting [0.0]
本稿では,ガウス過程(GP)を基礎構造を持つ平均回帰時系列の予測に適用する。
GPは、平均予測だけでなく、将来の軌道上の確率分布全体を予測する可能性を提供する。
これは、不正なボラティリティ評価が資本損失につながる場合、正確な予測だけでは十分でない金融状況において特に有益である。
論文 参考訳(メタデータ) (2024-02-23T06:09:45Z) - RF+clust for Leave-One-Problem-Out Performance Prediction [0.9281671380673306]
本稿では,LOPO(Left-one-problem-out)のパフォーマンス予測について検討する。
我々は、標準ランダムフォレスト(RF)モデル予測が性能値の重み付き平均値で校正することで改善できるかどうかを解析する。
論文 参考訳(メタデータ) (2023-01-23T16:14:59Z) - Statistics and Deep Learning-based Hybrid Model for Interpretable
Anomaly Detection [0.0]
ハイブリッド手法は、予測タスクと予測タスクの両方において、純粋統計的および純粋深層学習法より優れていることが示されている。
MES-LSTMは、これらの課題を克服する解釈可能な異常検出モデルである。
論文 参考訳(メタデータ) (2022-02-25T14:17:03Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Uncertainty-aware Remaining Useful Life predictor [57.74855412811814]
有効寿命 (Remaining Useful Life, RUL) とは、特定の産業資産の運用期間を推定する問題である。
本研究では,Deep Gaussian Processes (DGPs) を,前述の制限に対する解決策と捉える。
アルゴリズムの性能はNASAの航空機エンジン用N-CMAPSSデータセットで評価される。
論文 参考訳(メタデータ) (2021-04-08T08:50:44Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - DoubleEnsemble: A New Ensemble Method Based on Sample Reweighting and
Feature Selection for Financial Data Analysis [22.035287788330663]
学習軌道に基づくサンプル再重み付けとシャッフルに基づく特徴選択を利用したアンサンブルフレームワークであるDoubleEnsembleを提案する。
我々のモデルは、複雑なパターンを抽出できる幅広い基盤モデルに適用でき、金融市場の予測に過度に適合し、不安定な問題を緩和できる。
論文 参考訳(メタデータ) (2020-10-03T02:57:10Z) - Learning low-frequency temporal patterns for quantitative trading [0.0]
我々は、低周波の金融時系列データから信号を学習するための、モジュール化されたオンライン機械学習フレームワークの実現性を検討する。
このフレームワークは、JSEの株式市場から毎日サンプル化された時系列データに基づいて証明されている。
論文 参考訳(メタデータ) (2020-08-12T11:59:15Z) - Deep Stock Predictions [58.720142291102135]
本稿では,Long Short Term Memory (LSTM) ニューラルネットワークを用いてポートフォリオ最適化を行うトレーディング戦略の設計について考察する。
次に、LSTMのトレーニングに使用する損失関数をカスタマイズし、利益を上げる。
カスタマイズされた損失関数を持つLSTMモデルは、ARIMAのような回帰ベースライン上でのトレーニングボットの性能を向上させる。
論文 参考訳(メタデータ) (2020-06-08T23:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。