論文の概要: MCI-GRU: Stock Prediction Model Based on Multi-Head Cross-Attention and Improved GRU
- arxiv url: http://arxiv.org/abs/2410.20679v1
- Date: Wed, 25 Sep 2024 14:37:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-03 10:14:34.488881
- Title: MCI-GRU: Stock Prediction Model Based on Multi-Head Cross-Attention and Improved GRU
- Title(参考訳): MCI-GRU:マルチヘッドクロスアテンションと改良GRUに基づく株価予測モデル
- Authors: Peng Zhu, Yuante Li, Yifan Hu, Sheng Xiang, Qinyuan Liu, Dawei Cheng, Yuqi Liang,
- Abstract要約: 本稿では,多頭部クロスアテンション機構と改良型GRUに基づくストック予測モデルMCI-GRUを提案する。
4つの主要株式市場での実験では、提案手法は複数の指標でSOTA技術を上回っている。
- 参考スコア(独自算出の注目度): 15.232546605091818
- License:
- Abstract: As financial markets grow increasingly complex in the big data era, accurate stock prediction has become more critical. Traditional time series models, such as GRUs, have been widely used but often struggle to capture the intricate nonlinear dynamics of markets, particularly in the flexible selection and effective utilization of key historical information. Recently, methods like Graph Neural Networks and Reinforcement Learning have shown promise in stock prediction but require high data quality and quantity, and they tend to exhibit instability when dealing with data sparsity and noise. Moreover, the training and inference processes for these models are typically complex and computationally expensive, limiting their broad deployment in practical applications. Existing approaches also generally struggle to capture unobservable latent market states effectively, such as market sentiment and expectations, microstructural factors, and participant behavior patterns, leading to an inadequate understanding of market dynamics and subsequently impact prediction accuracy. To address these challenges, this paper proposes a stock prediction model, MCI-GRU, based on a multi-head cross-attention mechanism and an improved GRU. First, we enhance the GRU model by replacing the reset gate with an attention mechanism, thereby increasing the model's flexibility in selecting and utilizing historical information. Second, we design a multi-head cross-attention mechanism for learning unobservable latent market state representations, which are further enriched through interactions with both temporal features and cross-sectional features. Finally, extensive experiments on four main stock markets show that the proposed method outperforms SOTA techniques across multiple metrics. Additionally, its successful application in real-world fund management operations confirms its effectiveness and practicality.
- Abstract(参考訳): ビッグデータ時代に金融市場が複雑化するにつれ、正確な株価予測がますます重要になっている。
GRUのような伝統的な時系列モデルは広く使われているが、特に重要な歴史的情報の柔軟な選択と効果的な利用において、市場の複雑な非線形ダイナミクスを捉えるのに苦労することが多い。
最近、グラフニューラルネットワークや強化学習のような手法は、ストック予測の可能性を示しているが、高いデータ品質と量を必要とする。
さらに、これらのモデルのトレーニングと推論プロセスは一般的に複雑で計算コストがかかり、実用アプリケーションへの広範な展開が制限される。
既存のアプローチは、市場センチメントや期待、ミクロな要因、参加者の行動パターンといった、観測不可能な潜在市場状態を効果的に捉えるのにも苦慮しており、市場ダイナミクスの不十分な理解をもたらし、その後予測精度に影響を及ぼす。
これらの課題に対処するため,本研究では,多面的クロスアテンション機構と改良型GRUに基づくストック予測モデル MCI-GRU を提案する。
まず、リセットゲートをアテンション機構に置き換えることでGRUモデルを強化し、歴史的情報の選択・活用におけるモデルの柔軟性を向上させる。
第2に,時間的特徴と断面的特徴の両方との相互作用により,さらに充実した,観測不能な潜在市場状態表現を学習するためのマルチヘッド・クロスアテンション機構を設計する。
最後に,4つの主要株式市場での広範な実験により,提案手法が複数の指標においてSOTA技術より優れていることが示された。
さらに、実世界のファンドマネジメント業務におけるその成功例は、その有効性と実用性を確認している。
関連論文リスト
- Breaking Down Financial News Impact: A Novel AI Approach with Geometric Hypergraphs [9.618393813409266]
急激で不安定な金融市場では、金融ニュースに基づく株価の動きを正確に予測することが投資家やアナリストにとって重要である。
伝統的なモデルは、しばしばニュースイベントと市場の反応の間の複雑なダイナミックな関係を捉えるのに苦労する。
本稿では、金融ニュースが市場行動に与える影響を分析するために、説明可能な人工知能(XAI)を活用した新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-08-31T12:18:45Z) - Reprogramming Foundational Large Language Models(LLMs) for Enterprise Adoption for Spatio-Temporal Forecasting Applications: Unveiling a New Era in Copilot-Guided Cross-Modal Time Series Representation Learning [0.0]
パティオ時間予測は、輸送システム、物流、サプライチェーン管理など、様々な分野において重要な役割を担っている。
本稿では,オープンソースの大規模・小規模言語モデル(LLM,LM)と従来の予測手法を組み合わせたハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2024-08-26T16:11:53Z) - F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - DiffSTOCK: Probabilistic relational Stock Market Predictions using Diffusion Models [1.9662978733004601]
我々は、歴史的金融指標とストック間関係を前提とした、より良い市場予測を提供するためのアーキテクチャを開発する。
また,Masked Transformer (RTM) を用いて,ストック間関係と歴史的ストックの特徴を生かした新しい決定論的アーキテクチャ MTCHS を提供する。
論文 参考訳(メタデータ) (2024-03-21T01:20:32Z) - Stockformer: A Price-Volume Factor Stock Selection Model Based on Wavelet Transform and Multi-Task Self-Attention Networks [3.7608255115473592]
本稿では,ウェーブレット変換とマルチタスク自己アテンションネットワークを統合した価格-体積係数ストックセレクションモデルであるStockformerを紹介する。
ストックフォーマーは、株価のリターンを高頻度と低頻度に分解し、長期市場の動向と急激な出来事を注意深く捉えている。
実験結果から、Stockformerは複数の実市場データセットにおいて、既存の先進的な手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-11-23T04:33:47Z) - Diffusion Variational Autoencoder for Tackling Stochasticity in
Multi-Step Regression Stock Price Prediction [54.21695754082441]
長期的地平線上での多段階の株価予測は、ボラティリティの予測に不可欠である。
多段階の株価予測に対する現在の解決策は、主に単一段階の分類に基づく予測のために設計されている。
深層階層型変分オートコーダ(VAE)と拡散確率的手法を組み合わせてセック2seqの株価予測を行う。
本モデルでは, 予測精度と分散性の観点から, 最先端の解よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-18T16:21:15Z) - Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [51.3422222472898]
ニュース見出しを用いて,ChatGPTのような大規模言語モデル(LLM)の株価変動を予測する能力について述べる。
我々は,情報容量制約,過小反応,制限対アビタージュ,LLMを組み込んだ理論モデルを構築した。
論文 参考訳(メタデータ) (2023-04-15T19:22:37Z) - Augmented Bilinear Network for Incremental Multi-Stock Time-Series
Classification [83.23129279407271]
本稿では,有価証券のセットで事前学習したニューラルネットワークで利用可能な知識を効率的に保持する手法を提案する。
本手法では,既存の接続を固定することにより,事前学習したニューラルネットワークに符号化された事前知識を維持する。
この知識は、新しいデータを用いて最適化された一連の拡張接続によって、新しい証券に対して調整される。
論文 参考訳(メタデータ) (2022-07-23T18:54:10Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。