論文の概要: Event-Aware Sentiment Factors from LLM-Augmented Financial Tweets: A Transparent Framework for Interpretable Quant Trading
- arxiv url: http://arxiv.org/abs/2508.07408v1
- Date: Sun, 10 Aug 2025 16:09:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.848364
- Title: Event-Aware Sentiment Factors from LLM-Augmented Financial Tweets: A Transparent Framework for Interpretable Quant Trading
- Title(参考訳): LLM強化金融つぶやきからのイベント認識知覚因子:量子トレーディングを解釈するための透過的フレームワーク
- Authors: Yueyi Wang, Qiyao Wei,
- Abstract要約: 本研究では,金融意味論とアルファ信号発見における大規模言語モデル(LLM)のユニークな有用性を示す。
LLMを使用して、マルチラベルイベントカテゴリを高感度のツイートに自動的に割り当てる。
実験の結果、特定のイベントラベルは負のアルファを連続的に生成し、シャープ比は-0.38、情報係数は0.05を超えることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this study, we wish to showcase the unique utility of large language models (LLMs) in financial semantic annotation and alpha signal discovery. Leveraging a corpus of company-related tweets, we use an LLM to automatically assign multi-label event categories to high-sentiment-intensity tweets. We align these labeled sentiment signals with forward returns over 1-to-7-day horizons to evaluate their statistical efficacy and market tradability. Our experiments reveal that certain event labels consistently yield negative alpha, with Sharpe ratios as low as -0.38 and information coefficients exceeding 0.05, all statistically significant at the 95\% confidence level. This study establishes the feasibility of transforming unstructured social media text into structured, multi-label event variables. A key contribution of this work is its commitment to transparency and reproducibility; all code and methodologies are made publicly available. Our results provide compelling evidence that social media sentiment is a valuable, albeit noisy, signal in financial forecasting and underscore the potential of open-source frameworks to democratize algorithmic trading research.
- Abstract(参考訳): 本研究では,金融意味論とアルファ信号発見において,大規模言語モデル(LLM)のユニークな有用性を示す。
企業関連ツイートのコーパスを活用することで、LLMを使用して、複数のラベルのイベントカテゴリを高感度のツイートに自動的に割り当てる。
我々は,これらのラベル付き感情信号と1~7日間の地平線上の前方リターンとを一致させ,その統計的有効性と市場トレーダビリティを評価する。
実験の結果, シャープ比が-0.38であり, 情報係数が0.05を超え, 確率的に95%の信頼度で統計的に有意な結果が得られた。
本研究では、構造化されていないソーシャルメディアテキストを構造化されたマルチラベルイベント変数に変換する可能性を確立する。
この作業の重要な貢献は、透明性と再現性へのコミットメントであり、すべてのコードと方法論が公開されています。
我々の結果は、ソーシャルメディアの感情が価値があり、騒々しいが、財務予測のシグナルであり、アルゴリズムトレーディング研究を民主化するためのオープンソースフレームワークの可能性を強調しているという説得力のある証拠を提供する。
関連論文リスト
- An exploration of features to improve the generalisability of fake news detection models [0.0]
既存のNLPおよび教師付き機械学習メソッドは、クロスバリデーションの下ではうまく機能するが、データセットをまたいだ一般化に苦慮する。
この問題は、記事がパブリッシャに基づいてラベル付けされる、粗いラベル付きトレーニングデータに起因している。
本研究は, 粗いラベル付きデータから意味のある特徴を抽出し, 実世界のロバスト性を向上させることを実証した。
論文 参考訳(メタデータ) (2025-02-27T17:26:56Z) - Zero-to-Strong Generalization: Eliciting Strong Capabilities of Large Language Models Iteratively without Gold Labels [75.77877889764073]
大規模言語モデル(LLM)は,ゴールドラベルを用いた教師付き微調整やテキスト内学習を通じて,顕著な性能を示した。
本研究では,ラベルのないデータのみを利用することで,強力なモデル機能を実現することができるかどうかを考察する。
ゼロ・ツー・ストロング一般化と呼ばれる新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2024-09-19T02:59:44Z) - Uncertainty Aware Learning for Language Model Alignment [97.36361196793929]
異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。
トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。
広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文 参考訳(メタデータ) (2024-06-07T11:37:45Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning [52.257422715393574]
本稿では,Large Language Models (LLMs) の自己誘導手法を導入し,オープンソースデータセットからサクラサンプルを自動識別し,選択する。
我々の重要な革新である命令追従困難度(IFD)メトリックは、モデルが期待する応答と本質的な生成能力の相違を識別するための重要な指標として現れます。
論文 参考訳(メタデータ) (2023-08-23T09:45:29Z) - SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised
Learning [101.86916775218403]
本稿では, サンプル重み付けを統一した定式化により, 一般的な擬似ラベル法を再検討する。
トレーニング中の擬似ラベルの量と質を両立させることでトレードオフを克服するSoftMatchを提案する。
実験では、画像、テキスト、不均衡な分類など、さまざまなベンチマークで大幅に改善されている。
論文 参考訳(メタデータ) (2023-01-26T03:53:25Z) - Denoised Labels for Financial Time-Series Data via Self-Supervised
Learning [5.743034166791607]
この研究は、トレーディングにおける画像分類と自己指導型学習の成功から着想を得ている。
本稿では,コンピュータビジョンの手法を金融時系列に適用し,騒音暴露を減らすという考え方について検討する。
以上の結果から,分類ラベルにより下流学習アルゴリズムの性能が向上することが示唆された。
論文 参考訳(メタデータ) (2021-12-19T12:54:20Z) - Trade When Opportunity Comes: Price Movement Forecasting via Locality-Aware Attention and Iterative Refinement Labeling [11.430440350359993]
2つの主成分を持つ価格変動予測フレームワークであるLARAを提案する。
LA-Attentionはマスク付きアテンションスキームを通じて潜在的に有益なサンプルを抽出する。
RA-Labelingは、潜在的に利益の出るサンプルのうるさいラベルを洗練させる。
LARAは、Qlibの量的投資プラットフォーム上で、いくつかの機械学習ベースの手法を大幅に上回っている。
論文 参考訳(メタデータ) (2021-07-26T05:52:42Z) - A Sentiment Analysis Approach to the Prediction of Market Volatility [62.997667081978825]
金融ニュースとツイートから抽出された感情とFTSE100の動きの関係を調べました。
ニュース見出しから得られた感情は、市場のリターンを予測するシグナルとして使われる可能性があるが、ボラティリティには当てはまらない。
我々は,新たな情報の到着に応じて,市場の変動を予測するための正確な分類器を開発した。
論文 参考訳(メタデータ) (2020-12-10T01:15:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。