論文の概要: SAE-FiRE: Enhancing Earnings Surprise Predictions Through Sparse Autoencoder Feature Selection
- arxiv url: http://arxiv.org/abs/2505.14420v2
- Date: Tue, 07 Oct 2025 14:03:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 15:38:20.386988
- Title: SAE-FiRE: Enhancing Earnings Surprise Predictions Through Sparse Autoencoder Feature Selection
- Title(参考訳): SAE-FiRE: スパースオートエンコーダ機能選択による予測予測の強化
- Authors: Huopu Zhang, Yanguang Liu, Miao Zhang, Zirui He, Mengnan Du,
- Abstract要約: SAE-FiRE (Sparse Autoencoder for Financial Representation Enhancement) フレームワークを提案する。
SAE-FiREはスパースオートエンコーダ(SAE)を使用して、大言語モデルから高密度なニューラル表現を解釈可能なスパースコンポーネントに分解する。
過度な適合につながる可能性のあるノイズを体系的にフィルタリングすることで、より堅牢で一般化可能な予測を可能にします。
- 参考スコア(独自算出の注目度): 29.540850801930276
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting earnings surprises from financial documents, such as earnings conference calls, regulatory filings, and financial news, has become increasingly important in financial economics. However, these financial documents present significant analytical challenges, typically containing over 5,000 words with substantial redundancy and industry-specific terminology that creates obstacles for language models. In this work, we propose the SAE-FiRE (Sparse Autoencoder for Financial Representation Enhancement) framework to address these limitations by extracting key information while eliminating redundancy. SAE-FiRE employs Sparse Autoencoders (SAEs) to decompose dense neural representations from large language models into interpretable sparse components, then applies statistical feature selection methods, including ANOVA F-tests and tree-based importance scoring, to identify the top-k most discriminative dimensions for classification. By systematically filtering out noise that might otherwise lead to overfitting, we enable more robust and generalizable predictions. Experimental results across three financial datasets demonstrate that SAE-FiRE significantly outperforms baseline approaches.
- Abstract(参考訳): 決算会議の電話会見や規制書類、金融ニュースなどの財務文書による業績予想のサプライズは、金融経済学においてますます重要になっている。
しかしながら、これらの財務文書は、典型的には、重大な冗長性を持つ5000以上の単語と、言語モデルの障害を生み出す業界固有の用語を含む、重大な分析上の課題を呈している。
本研究では,これらの制約に対して,冗長性を排除しつつ鍵情報を抽出して対処するためのSAE-FiRE(Sparse Autoencoder for Financial Representation Enhancement)フレームワークを提案する。
SAE-FiREは、Sparse Autoencoders (SAEs)を用いて、大きな言語モデルから解釈可能なスパースコンポーネントに高密度なニューラル表現を分解し、ANOVA F-testsや木に基づく重要度スコアなどの統計的特徴選択手法を適用して、分類の最も差別的な次元を識別する。
過度な適合につながる可能性のあるノイズを体系的にフィルタリングすることで、より堅牢で一般化可能な予測を可能にします。
3つの財務データセットに対する実験結果から、SAE-FiREはベースラインアプローチを大幅に上回っていることが示された。
関連論文リスト
- Truth in the Few: High-Value Data Selection for Efficient Multi-Modal Reasoning [71.3533541927459]
アクティベーション推論ポテンシャル(RAP)と呼ばれる新しいデータ選択パラダイムを提案する。
RAPは、真のマルチモーダル推論を刺激する各サンプルのポテンシャルを推定することで、認知サンプルを識別する。
我々のRAP法は、トレーニングデータの9.3%しか使用せず、計算コストを43%以上削減しながら、常に優れた性能を実現している。
論文 参考訳(メタデータ) (2025-06-05T08:40:24Z) - Evaluating Financial Sentiment Analysis with Annotators Instruction Assisted Prompting: Enhancing Contextual Interpretation and Stock Prediction Accuracy [1.481550828146527]
アノテータによるAIAP(Instruction Assisted Prompt)は、人間と機械の両方の解釈における感情の理解を標準化することを目的としている。
We use a new data, WSBS, derived from the WallStreetBets subreddit to demonstrate how AIAP significantly enhances LLM performance。
この文脈認識アプローチは、パフォーマンスの漸進的な向上をもたらし、また革新的な感情インデクシング手法も導入する。
論文 参考訳(メタデータ) (2025-05-09T19:44:04Z) - Supervised Optimism Correction: Be Confident When LLMs Are Sure [91.7459076316849]
教師付き微調整とオフライン強化学習の間には,新たな理論的関係が確立されている。
広く使われているビームサーチ法は、許容できない過度な最適化に悩まされていることを示す。
本稿では,トークンレベル$Q$-value推定のための簡易かつ効果的な補助的損失を導入したSupervised Optimism Correctionを提案する。
論文 参考訳(メタデータ) (2025-04-10T07:50:03Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - ECC Analyzer: Extract Trading Signal from Earnings Conference Calls using Large Language Model for Stock Performance Prediction [7.358590821647365]
本研究は, 大規模言語モデル(LLM)を用いてECCからよりリッチで予測性の高いコンテンツを抽出する, textbfECC Analyzer という新しいフレームワークを紹介する。
我々は、事前訓練された大規模モデルを用いて、ECCからテキストや音声の特徴を抽出し、階層的な情報抽出戦略を実装し、よりきめ細かい情報を抽出する。
実験により,本モデルが従来の分析ベンチマークより優れていることが示された。
論文 参考訳(メタデータ) (2024-04-29T07:11:39Z) - Towards reducing hallucination in extracting information from financial
reports using Large Language Models [1.2289361708127877]
本稿では,Large Language Models (LLMs) が業績報告書から効率的にかつ迅速に情報を抽出する方法を示す。
我々は,Q&Aシステム評価のための様々な客観的指標に基づいて,提案手法を使わずに,様々なLCMの結果を評価する。
論文 参考訳(メタデータ) (2023-10-16T18:45:38Z) - Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [51.3422222472898]
ニュース見出しを用いて,ChatGPTのような大規模言語モデル(LLM)の株価変動を予測する能力について述べる。
我々は,情報容量制約,過小反応,制限対アビタージュ,LLMを組み込んだ理論モデルを構築した。
論文 参考訳(メタデータ) (2023-04-15T19:22:37Z) - Semantic Information Marketing in The Metaverse: A Learning-Based
Contract Theory Framework [68.8725783112254]
仮想サービスプロバイダ(VSP)によるインセンティブのメカニズム設計の問題に対処し,センサデータ販売にIoTデバイスを採用。
帯域幅が限られているため,センサIoTデバイスによる配信データを削減するためにセマンティック抽出アルゴリズムを提案する。
本稿では,新しい反復型契約設計を提案し,マルチエージェント強化学習(MARL)の新たな変種を用いて,モデル付き多次元契約問題の解法を提案する。
論文 参考訳(メタデータ) (2023-02-22T15:52:37Z) - Multi-Domain Transformer-Based Counterfactual Augmentation for Earnings
Call Analysis [20.087027853160627]
本稿では,市場推測のための重要なECコンテンツのタスクインスパイアされた意義を注意深く定量化するトランスフォーマーベースのECエンコーダを提案する。
次に、勾配に基づく変動を評価するための多領域対実学習フレームワークを開発する。
実世界の金融データセットの実験は、解釈可能なMTCAの有効性を示し、最先端技術のボラティリティ評価能力を14.2%精度で向上させた。
論文 参考訳(メタデータ) (2021-12-02T03:40:17Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Towards Earnings Call and Stock Price Movement [7.196468151661785]
本稿では,ディープラーニングフレームワークを用いて,その言語を転写文でモデル化することを提案する。
提案モデルが従来の機械学習ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-23T20:38:14Z) - Foreseeing the Benefits of Incidental Supervision [83.08441990812636]
本稿では,実験を行なわずに,特定の目標タスクに対して,様々な種類の偶発信号の利点を定量化できるかどうかを考察する。
本稿では,PABI(PAC-Bayesian motivated informativeness measure)を提案する。
論文 参考訳(メタデータ) (2020-06-09T20:59:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。