論文の概要: Interpretable Machine Learning for Macro Alpha: A News Sentiment Case Study
- arxiv url: http://arxiv.org/abs/2505.16136v1
- Date: Thu, 22 May 2025 02:24:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:47.982308
- Title: Interpretable Machine Learning for Macro Alpha: A News Sentiment Case Study
- Title(参考訳): マクロアルファのための解釈可能な機械学習:ニュースセンティブケーススタディ
- Authors: Yuke Zhang,
- Abstract要約: 我々は、FinBERTを用いて、GDELT(Global Database of Events, Language, and Tone)プロジェクトの世界中のニュースフィードを処理する。
平均音、分散、事象の影響を取り入れた毎日の感情指標を構築した。
これらの指標は、ロジスティック回帰に対してベンチマークされたXGBoostを駆動し、次の日のリターンを予測する。
- 参考スコア(独自算出の注目度): 1.57731592348751
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study introduces an interpretable machine learning (ML) framework to extract macroeconomic alpha from global news sentiment. We process the Global Database of Events, Language, and Tone (GDELT) Project's worldwide news feed using FinBERT -- a Bidirectional Encoder Representations from Transformers (BERT) based model pretrained on finance-specific language -- to construct daily sentiment indices incorporating mean tone, dispersion, and event impact. These indices drive an XGBoost classifier, benchmarked against logistic regression, to predict next-day returns for EUR/USD, USD/JPY, and 10-year U.S. Treasury futures (ZN). Rigorous out-of-sample (OOS) backtesting (5-fold expanding-window cross-validation, OOS period: c. 2017-April 2025) demonstrates exceptional, cost-adjusted performance for the XGBoost strategy: Sharpe ratios achieve 5.87 (EUR/USD), 4.65 (USD/JPY), and 4.65 (Treasuries), with respective compound annual growth rates (CAGRs) exceeding 50% in Foreign Exchange (FX) and 22% in bonds. Shapley Additive Explanations (SHAP) affirm that sentiment dispersion and article impact are key predictive features. Our findings establish that integrating domain-specific Natural Language Processing (NLP) with interpretable ML offers a potent and explainable source of macro alpha.
- Abstract(参考訳): 本研究では,グローバルニュース感情からマクロ経済アルファを抽出する解釈可能な機械学習(ML)フレームワークを提案する。
我々は、金融特化言語に基づく双方向エンコーダ表現(BERT)に基づくモデルであるFinBERTを用いて、GDELT(Global Database of Events, Language, and Tone)プロジェクトの世界中のニュースフィードを処理し、平均トーン、分散、イベントの影響を取り入れた毎日の感情指標を構築する。
これらの指標は、ロジスティック回帰に対してベンチマークされたXGBoost分類器を駆動し、EUR/USD、USD/JPY、米国財務省の10年先物(ZN)の翌日のリターンを予測する。
厳密なアウト・オブ・サンブル(OOS)バックテスト(OOS期:2017年~2025年4月)は、XGBoost戦略における例外的かつコスト調整されたパフォーマンスを実証している:シャープ比は5.87(EUR/USD)、4.65(USD/JPY)、4.65(Treasuries)で、それぞれの複合年率(CAGRs)は外国為替(FX)で50%、債券は22%である。
Shapley Additive Explanations (SHAP)は、感情の分散と記事の影響が重要な予測的特徴であることを確認した。
この結果から,ドメイン固有自然言語処理(NLP)を解釈可能なMLと統合することで,マクロアルファの強力な説明可能な情報源が得られることが判明した。
関連論文リスト
- Innovative Sentiment Analysis and Prediction of Stock Price Using FinBERT, GPT-4 and Logistic Regression: A Data-Driven Approach [0.0]
本研究では、感情分析と株価指数予測のための最先端AIモデル、すなわちTranssformers (FinBERT)、Generatice Pre-trained Transformer GPT-4、Logistic Regressionの比較パフォーマンスについて検討する。
GPT-4やFinBERTといった高度な自然言語処理モデルと従来の機械学習モデルであるロジスティック回帰を活用することで、市場の感情を分類し、感情スコアを生成し、市場価格の動きを予測することを目指している。
論文 参考訳(メタデータ) (2024-12-07T05:20:31Z) - Harnessing Earnings Reports for Stock Predictions: A QLoRA-Enhanced LLM Approach [6.112119533910774]
本稿では、命令ベースの新しい手法と量子化低ランク適応(QLoRA)圧縮を組み合わせることで、LLM(Large Language Models)命令を微調整することで、高度なアプローチを提案する。
近年の市場指標やアナリストの成績等「外部要因」を統合して、リッチで教師付きデータセットを作成する。
この研究は、最先端のAIを微調整された財務データに統合する能力を実証するだけでなく、AI駆動の財務分析ツールを強化するための将来の研究の道を開く。
論文 参考訳(メタデータ) (2024-08-13T04:53:31Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - CIF-Bench: A Chinese Instruction-Following Benchmark for Evaluating the Generalizability of Large Language Models [53.9835961434552]
本研究では,中国語に対する大規模言語モデル(LLM)の一般化性を評価するために,中国語命令追跡ベンチマーク(CIF-Bench)を導入する。
CIF-Benchは150のタスクと15,000の入力出力ペアで構成され、複雑な推論と中国の文化的ニュアンスをテストするためにネイティブスピーカーによって開発された。
データ汚染を軽減するため、データセットの半分しか公開せず、残りは非公開であり、スコア分散を最小限に抑えるために多種多様な命令を導入する。
論文 参考訳(メタデータ) (2024-02-20T16:02:12Z) - Can Large Language Models Beat Wall Street? Unveiling the Potential of AI in Stock Selection [0.07499722271664146]
本稿では,GPT-4による金融市場における株式選択の先進的推論を活用する革新的なフレームワークであるMarketSenseAIを紹介する。
MarketSenseAIは、市場動向、ニュース、基礎、マクロ経済要因などさまざまなデータソースを分析し、専門家の投資決定をエミュレートする。
本研究は,金融意思決定における大規模言語モデルの変容の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2024-01-08T08:58:46Z) - Extrapolating Large Language Models to Non-English by Aligning Languages [109.09051737966178]
既存の大きな言語モデルは、異なる言語間で異なる能力を示す。
本稿では,言語間のセマンティックアライメントを構築することで,英語以外の言語に事前学習したLLMを強化する。
論文 参考訳(メタデータ) (2023-08-09T13:32:06Z) - Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [51.3422222472898]
ニュース見出しを用いて,ChatGPTのような大規模言語モデル(LLM)の株価変動を予測する能力について述べる。
我々は,情報容量制約,過小反応,制限対アビタージュ,LLMを組み込んだ理論モデルを構築した。
論文 参考訳(メタデータ) (2023-04-15T19:22:37Z) - BBT-Fin: Comprehensive Construction of Chinese Financial Domain
Pre-trained Language Model, Corpus and Benchmark [12.457193087920183]
我々は、T5モデルに基づく新しい中国の金融事前学習言語モデルであるBBT-FinT5を紹介する。
BBT-FinCorpusは,4つのソースから約300GBの原文を出力する大規模財務コーパスである。
論文 参考訳(メタデータ) (2023-02-18T22:20:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。