論文の概要: Feature Selection for Forecasting
- arxiv url: http://arxiv.org/abs/2303.02223v1
- Date: Fri, 3 Mar 2023 21:33:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-07 20:49:58.294139
- Title: Feature Selection for Forecasting
- Title(参考訳): 予測のための特徴選択
- Authors: Hakan Pabuccu and Adrian Barbu
- Abstract要約: Annealing (FSA)アルゴリズムは、およそ1000の予測値から特徴を選択するために使用された。
実験の結果,FSAアルゴリズムは問題の種類に関わらず,MLモデルの性能を高めた。
FSAは、より良いパフォーマンス指標と時間の短縮の両方でモデルパフォーマンスを改善することが観察された。
- 参考スコア(独自算出の注目度): 4.94950858749529
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work investigates the importance of feature selection for improving the
forecasting performance of machine learning algorithms for financial data.
Artificial neural networks (ANN), convolutional neural networks (CNN),
long-short term memory (LSTM) networks, as well as linear models were applied
for forecasting purposes. The Feature Selection with Annealing (FSA) algorithm
was used to select the features from about 1000 possible predictors obtained
from 26 technical indicators with specific periods and their lags. In addition
to this, the Boruta feature selection algorithm was applied as a baseline
feature selection method. The dependent variables consisted of daily
logarithmic returns and daily trends of ten financial data sets, including
cryptocurrency and different stocks. Experiments indicate that the FSA
algorithm increased the performance of ML models regardless of the problem
type. The FSA hybrid machine learning models showed better performance in 10
out of 10 data sets for regression and 8 out of 10 data sets for
classification. None of the hybrid Boruta models outperformed the hybrid FSA
models. However, the BORCNN model performance was comparable to the best model
for 4 out of 10 data sets for regression estimates. BOR-LR and BOR-CNN models
showed comparable performance with the best hybrid FSA models in 2 out of 10
datasets for classification. FSA was observed to improve the model performance
in both better performance metrics as well as a decreased computation time by
providing a lower dimensional input feature space.
- Abstract(参考訳): 本研究では,財務データに対する機械学習アルゴリズムの予測性能向上のための特徴選択の重要性を検討する。
予測には、ニューラルネットワーク(ANN)、畳み込みニューラルネットワーク(CNN)、長期記憶(LSTM)ネットワーク、線形モデルを適用した。
アニーリング(英語版)(fsa)アルゴリズムによる特徴選択は、特定の期間とその遅れを伴う26の技術指標から得られた約1000個の予測器から特徴を選択するために用いられた。
これに加えて、ボータ特徴選択アルゴリズムを基本特徴選択法として適用した。
依存変数は、暗号通貨や異なる株を含む10の金融データセットの日次対数リターンと日次トレンドで構成されていた。
実験の結果,FSAアルゴリズムは問題の種類に関わらず,MLモデルの性能を高めた。
fsaハイブリッド機械学習モデルでは、回帰用データセット10個中10個、分類用データセット10個中8個でパフォーマンスが向上した。
ハイブリッドボリュータモデルはいずれもハイブリッドfsaモデルよりも優れていない。
しかし、borcnnモデルのパフォーマンスは、回帰推定のためのデータセット10のうち4つで最高のモデルに匹敵するものだった。
BOR-LRモデルとBOR-CNNモデルは、分類のための10のデータセットのうち2つで最高のハイブリッドFSAモデルと同等の性能を示した。
FSAは、低次元の入力特徴空間を提供することで、より良い性能指標と計算時間の両方でモデル性能を向上させることが観察された。
関連論文リスト
- F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Enhancing Mean-Reverting Time Series Prediction with Gaussian Processes:
Functional and Augmented Data Structures in Financial Forecasting [0.0]
本稿では,ガウス過程(GP)を基礎構造を持つ平均回帰時系列の予測に適用する。
GPは、平均予測だけでなく、将来の軌道上の確率分布全体を予測する可能性を提供する。
これは、不正なボラティリティ評価が資本損失につながる場合、正確な予測だけでは十分でない金融状況において特に有益である。
論文 参考訳(メタデータ) (2024-02-23T06:09:45Z) - RF+clust for Leave-One-Problem-Out Performance Prediction [0.9281671380673306]
本稿では,LOPO(Left-one-problem-out)のパフォーマンス予測について検討する。
我々は、標準ランダムフォレスト(RF)モデル予測が性能値の重み付き平均値で校正することで改善できるかどうかを解析する。
論文 参考訳(メタデータ) (2023-01-23T16:14:59Z) - Statistics and Deep Learning-based Hybrid Model for Interpretable
Anomaly Detection [0.0]
ハイブリッド手法は、予測タスクと予測タスクの両方において、純粋統計的および純粋深層学習法より優れていることが示されている。
MES-LSTMは、これらの課題を克服する解釈可能な異常検出モデルである。
論文 参考訳(メタデータ) (2022-02-25T14:17:03Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Uncertainty-aware Remaining Useful Life predictor [57.74855412811814]
有効寿命 (Remaining Useful Life, RUL) とは、特定の産業資産の運用期間を推定する問題である。
本研究では,Deep Gaussian Processes (DGPs) を,前述の制限に対する解決策と捉える。
アルゴリズムの性能はNASAの航空機エンジン用N-CMAPSSデータセットで評価される。
論文 参考訳(メタデータ) (2021-04-08T08:50:44Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - DoubleEnsemble: A New Ensemble Method Based on Sample Reweighting and
Feature Selection for Financial Data Analysis [22.035287788330663]
学習軌道に基づくサンプル再重み付けとシャッフルに基づく特徴選択を利用したアンサンブルフレームワークであるDoubleEnsembleを提案する。
我々のモデルは、複雑なパターンを抽出できる幅広い基盤モデルに適用でき、金融市場の予測に過度に適合し、不安定な問題を緩和できる。
論文 参考訳(メタデータ) (2020-10-03T02:57:10Z) - Learning low-frequency temporal patterns for quantitative trading [0.0]
我々は、低周波の金融時系列データから信号を学習するための、モジュール化されたオンライン機械学習フレームワークの実現性を検討する。
このフレームワークは、JSEの株式市場から毎日サンプル化された時系列データに基づいて証明されている。
論文 参考訳(メタデータ) (2020-08-12T11:59:15Z) - Deep Stock Predictions [58.720142291102135]
本稿では,Long Short Term Memory (LSTM) ニューラルネットワークを用いてポートフォリオ最適化を行うトレーディング戦略の設計について考察する。
次に、LSTMのトレーニングに使用する損失関数をカスタマイズし、利益を上げる。
カスタマイズされた損失関数を持つLSTMモデルは、ARIMAのような回帰ベースライン上でのトレーニングボットの性能を向上させる。
論文 参考訳(メタデータ) (2020-06-08T23:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。