論文の概要: GroupSHAP-Guided Integration of Financial News Keywords and Technical Indicators for Stock Price Prediction
- arxiv url: http://arxiv.org/abs/2510.23112v1
- Date: Mon, 27 Oct 2025 08:33:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 17:41:22.006896
- Title: GroupSHAP-Guided Integration of Financial News Keywords and Technical Indicators for Stock Price Prediction
- Title(参考訳): GroupSHAPによる株価予測のための金融ニュースキーワードと技術指標の統合
- Authors: Minjoo Kim, Jinwoong Kim, Sangjin Park,
- Abstract要約: GroupSHAPは、個々のトークンではなく、意味的に関連するキーワードグループのコントリビューションを定量化する。
我々は、2015年から2024年までのニュース記事の埋め込みにFinBERTを使用し、それらを一貫性のあるセマンティックグループに分類し、各グループの株価変動に対する貢献度を測定するためにGroupSHAPを適用した。
2024年を通してのS&P500指数の1日ごとの予測による実証結果は、我々のアプローチがMAEの32.2%、RMSEの40.5%の減少を達成することを示している。
- 参考スコア(独自算出の注目度): 5.287763385823119
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in finance-specific language models such as FinBERT have enabled the quantification of public sentiment into index-based measures, yet compressing diverse linguistic signals into single metrics overlooks contextual nuances and limits interpretability. To address this limitation, explainable AI techniques, particularly SHAP (SHapley Additive Explanations), have been employed to identify influential features. However, SHAP's computational cost grows exponentially with input features, making it impractical for large-scale text-based financial data. This study introduces a GRU-based forecasting framework enhanced with GroupSHAP, which quantifies contributions of semantically related keyword groups rather than individual tokens, substantially reducing computational burden while preserving interpretability. We employed FinBERT to embed news articles from 2015 to 2024, clustered them into coherent semantic groups, and applied GroupSHAP to measure each group's contribution to stock price movements. The resulting group-level SHAP variables across multiple topics were used as input features for the prediction model. Empirical results from one-day-ahead forecasting of the S&P 500 index throughout 2024 demonstrate that our approach achieves a 32.2% reduction in MAE and a 40.5% reduction in RMSE compared with benchmark models without the GroupSHAP mechanism. This research presents the first application of GroupSHAP in news-driven financial forecasting, showing that grouped sentiment representations simultaneously enhance interpretability and predictive performance.
- Abstract(参考訳): FinBERTのような金融特化言語モデルの最近の進歩により、公共の感情を指標に基づく尺度に定量化できる一方で、多様な言語信号を単一のメトリクスに圧縮することで、文脈的ニュアンスを見越し、解釈可能性を制限することができる。
この制限に対処するために、説明可能なAI技術、特にSHAP(SHapley Additive Explanations)は、影響力のある特徴を特定するために使用されている。
しかし、SHAPの計算コストは入力機能とともに指数関数的に増加し、大規模なテキストベースの財務データには実用的ではない。
本研究はGRUベースの予測フレームワークをGSHAPで強化し,個々のトークンよりも意味論的キーワード群の貢献を定量化し,解釈可能性を維持しながら計算負担を大幅に軽減する。
我々は、2015年から2024年までのニュース記事の埋め込みにFinBERTを使用し、それらを一貫性のあるセマンティックグループに分類し、各グループの株価変動に対する貢献度を測定するためにGroupSHAPを適用した。
その結果,複数のトピックにまたがるグループレベルのSHAP変数を,予測モデルの入力特徴として用いた。
2024年を通してのS&P500指数の1日ごとの予測結果から,本手法は, GroupSHAP機構を持たないベンチマークモデルと比較して,MAEの32.2%削減とRMSEの40.5%削減を実現していることが示された。
本研究は、ニュース駆動型財務予測におけるGroupSHAPの最初の応用として、グループ化された感情表現は、解釈可能性と予測性能を同時に向上することを示す。
関連論文リスト
- IKNet: Interpretable Stock Price Prediction via Keyword-Guided Integration of News and Technical Indicators [3.5795275871379704]
個別のニュースキーワードと株価の動きのセマンティックな関連をモデル化するための解釈可能なキーワード誘導ネットワーク(IKNet)を提案する。
IKNetは、FinBERTベースの文脈分析を通じて有能なキーワードを特定し、それぞれの表現を別々の非線形投影層を通して処理し、その表現を技術指標の時系列データと統合し、翌日の閉値を予測する。
2015年から2024年にかけてのS&P 500データの実証的な評価は、IKNetがリカレントニューラルネットワークやトランスフォーマーモデルを含むベースラインを上回り、RMSEを最大32.9%削減し、累積リターンを18.5%改善したことを示している。
論文 参考訳(メタデータ) (2025-10-09T01:30:30Z) - Interpretable Machine Learning for Macro Alpha: A News Sentiment Case Study [1.57731592348751]
我々は、FinBERTを用いて、GDELT(Global Database of Events, Language, and Tone)プロジェクトの世界中のニュースフィードを処理する。
平均音、分散、事象の影響を取り入れた毎日の感情指標を構築した。
これらの指標は、ロジスティック回帰に対してベンチマークされたXGBoostを駆動し、次の日のリターンを予測する。
論文 参考訳(メタデータ) (2025-05-22T02:24:45Z) - FinTSB: A Comprehensive and Practical Benchmark for Financial Time Series Forecasting [58.70072722290475]
ファイナンシャル・タイム・シリーズ(FinTS)は、人間の脳を増強した意思決定の行動を記録する。
FinTSBは金融時系列予測のための総合的で実用的なベンチマークである。
論文 参考訳(メタデータ) (2025-02-26T05:19:16Z) - Consistency Checks for Language Model Forecasters [54.62507816753479]
予測器の性能を,論理的に異なる質問に対する予測の整合性の観点から測定する。
我々は,一連の基本質問を生成し,これらの質問から整合性チェックをインスタンス化し,予測者の予測を導き,予測の整合性を測定する自動評価システムを構築した。
論文 参考訳(メタデータ) (2024-12-24T16:51:35Z) - BreakGPT: Leveraging Large Language Models for Predicting Asset Price Surges [55.2480439325792]
本稿では,時系列予測や資産価格の急上昇の予測に特化して,新たな大規模言語モデル(LLM)アーキテクチャであるBreakGPTを紹介する。
我々は、最小限のトレーニングで財務予測を行うための有望なソリューションとしてBreakGPTを紹介し、局所的およびグローバルな時間的依存関係をキャプチャする強力な競合相手として紹介する。
論文 参考訳(メタデータ) (2024-11-09T05:40:32Z) - Harnessing Earnings Reports for Stock Predictions: A QLoRA-Enhanced LLM Approach [6.112119533910774]
本稿では、命令ベースの新しい手法と量子化低ランク適応(QLoRA)圧縮を組み合わせることで、LLM(Large Language Models)命令を微調整することで、高度なアプローチを提案する。
近年の市場指標やアナリストの成績等「外部要因」を統合して、リッチで教師付きデータセットを作成する。
この研究は、最先端のAIを微調整された財務データに統合する能力を実証するだけでなく、AI駆動の財務分析ツールを強化するための将来の研究の道を開く。
論文 参考訳(メタデータ) (2024-08-13T04:53:31Z) - AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework [48.3060010653088]
我々はAlphaFinデータセットをリリースし、従来の研究データセット、リアルタイム財務データ、手書きのチェーン・オブ・プリート(CoT)データを組み合わせています。
次に、AlphaFinデータセットを使用して、金融分析タスクを効果的に処理するために、Stock-Chainと呼ばれる最先端の手法をベンチマークします。
論文 参考訳(メタデータ) (2024-03-19T09:45:33Z) - Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [51.3422222472898]
ニュース見出しを用いて,ChatGPTのような大規模言語モデル(LLM)の株価変動を予測する能力について述べる。
我々は,情報容量制約,過小反応,制限対アビタージュ,LLMを組み込んだ理論モデルを構築した。
論文 参考訳(メタデータ) (2023-04-15T19:22:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。