論文の概要: Causal Reconstruction of Sentiment Signals from Sparse News Data
- arxiv url: http://arxiv.org/abs/2603.23568v1
- Date: Tue, 24 Mar 2026 09:13:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:10.944523
- Title: Causal Reconstruction of Sentiment Signals from Sparse News Data
- Title(参考訳): スパースニュースデータによる知覚信号の因果的再構成
- Authors: Stefania Stan, Marzio Lunghi, Vito Vargetto, Claudio Ricci, Rolands Repetto, Brayden Leo, Shao-Hong Gan,
- Abstract要約: スパースニュースに由来する感度信号は、金融分析や技術監視によく用いられる。
記事レベルスコアを正規時間グリッドに集約する3段階パイプラインを提案する。
我々は,AI関連ニュースタイトルのデータセットに対して,株価データに対する再構成信号の整合性を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Sentiment signals derived from sparse news are commonly used in financial analysis and technology monitoring, yet transforming raw article-level observations into reliable temporal series remains a largely unsolved engineering problem. Rather than treating this as a classification challenge, we propose to frame it as a causal signal reconstruction problem: given probabilistic sentiment outputs from a fixed classifier, recover a stable latent sentiment series that is robust to the structural pathologies of news data such as sparsity, redundancy, and classifier uncertainty. We present a modular three-stage pipeline that (i) aggregates article-level scores onto a regular temporal grid with uncertainty-aware and redundancy-aware weights, (ii) fills coverage gaps through strictly causal projection rules, and (iii) applies causal smoothing to reduce residual noise. Because ground-truth longitudinal sentiment labels are typically unavailable, we introduce a label-free evaluation framework based on signal stability diagnostics, information preservation lag proxies, and counterfactual tests for causality compliance and redundancy robustness. As a secondary external check, we evaluate the consistency of reconstructed signals against stock-price data for a multi-firm dataset of AI-related news titles (November 2024 to February 2026). The key empirical finding is a three-week lead lag pattern between reconstructed sentiment and price that persists across all tested pipeline configurations and aggregation regimes, a structural regularity more informative than any single correlation coefficient. Overall, the results support the view that stable, deployable sentiment indicators require careful reconstruction, not only better classifiers.
- Abstract(参考訳): スパースニュースから得られる感度信号は、金融分析や技術監視に一般的に用いられているが、生記事レベルの観測を信頼できる時系列に変換することは、ほとんど未解決の工学的問題である。
これを分類問題として扱うのではなく、固定分類器からの確率的感情出力を与えられた場合、空間性、冗長性、分類器の不確実性などのニュースデータの構造的病理に頑健な安定な潜時感情系列を復元する。
モジュール型3段階パイプラインを提案する。
i) 記事レベルのスコアを、不確実性を認識し、冗長性を認識する重みを持つ通常の時間的グリッドに集約する。
二 厳格な因果射影規則により範囲を埋め、
(三)残音低減のために因果平滑化を施す。
そのため,信号安定性診断,情報保存ラグプロキシ,因果性コンプライアンスと冗長性の検証に基づくラベルフリー評価フレームワークを導入する。
二次外部チェックとして,AI関連ニュースタイトルの多確認データセット(2024年11月~2026年2月)のストック価格データに対する再構成信号の整合性を評価する。
重要な経験的発見は、再構成された感情と価格の間の3週間のリードラグパターンであり、テストされたパイプライン構成とアグリゲーションレシエーション全体にわたって持続する。
全体として、結果は安定したデプロイ可能なインセンティブインジケータは、より優れた分類器だけでなく、慎重に再構築する必要があるという見解を支持している。
関連論文リスト
- Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction [2.289837306672451]
規制ストレステストでは、仮説的なマクロ経済シナリオの下で信用損失を予測する必要がある。
パネルにおけるポリシーパスの反ファクト推論のためのフレームワークを提案する。
実失業データを用いたシミュレーションおよび半合成実験により,すべての結果を検証した。
論文 参考訳(メタデータ) (2026-03-08T03:22:38Z) - The Stationarity Bias: Stratified Stress-Testing for Time-Series Imputation in Regulated Dynamical Systems [0.098314893665023]
時系列計算ベンチマークはランダムマスキングと形状に依存しないメトリクスを使用する。
我々は、このバイアスを形式化し、評価を定常型と過渡型に分割するemphStratified Stress-Testを提案する。
論文 参考訳(メタデータ) (2026-02-17T15:05:56Z) - A Representation-Consistent Gated Recurrent Framework for Robust Medical Time-Series Classification [0.0]
隠れ状態表現における時間的一貫性を強制する規則化された正規化戦略を導入するための表現一貫性を持つゲートリカレントフレームワーク(RC-GRF)を提案する。
提案するフレームワークはモデルに依存しないため,内部ゲーティング機構を変更することなく,既存のゲート型リカレントアーキテクチャに統合することができる。
論文 参考訳(メタデータ) (2026-02-10T17:16:49Z) - Generalizing GNNs with Tokenized Mixture of Experts [75.8310720413187]
安定性の向上には,変化に敏感な特徴への依存を低減し,既約最悪の一般化フロアを残す必要があることを示す。
本研究では,STEM-GNNを提案する。STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN,STEM-GNN。
9つのノード、リンク、グラフのベンチマークで、STEM-GNNはより強力な3方向バランスを実現し、クリアグラフ上での競争力を維持しながら、次数/ホモフィリーシフトや特徴/エッジの破損に対する堅牢性を改善している。
論文 参考訳(メタデータ) (2026-02-09T22:48:30Z) - Semi-supervised and unsupervised learning for health indicator extraction from guided waves in aerospace composite structures [0.6922116595976161]
健康指標(HIs)は、航空宇宙複合構造物の状態の診断と診断の中心である。
本研究では、マルチドメイン信号処理と統合された2つの学習手法を用いてHIを学習するデータ駆動型フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-28T16:44:11Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - SVeritas: Benchmark for Robust Speaker Verification under Diverse Conditions [54.34001921326444]
話者検証(SV)モデルは、セキュリティ、パーソナライゼーション、アクセス制御システムにますます統合されている。
既存のベンチマークでは、これらの条件のサブセットのみを評価しており、他は完全に欠落している。
SVeritasは、録音時間、自発性、コンテンツ、ノイズ、マイクロホン距離、残響、チャンネルミスマッチ、オーディオ帯域幅、コーデック、話者年齢、スプーフィングおよび敵攻撃に対する感受性などのストレス下でのSVシステムの評価を行う総合的な話者検証タスクベンチマークスイートである。
論文 参考訳(メタデータ) (2025-09-21T14:11:16Z) - Towards Agents That Know When They Don't Know: Uncertainty as a Control Signal for Structured Reasoning [19.099363114326355]
大規模言語モデル(LLM)エージェントは、構造化されたバイオメディカルデータ環境にますますデプロイされる。
クエリ条件付きマルチテーブル要約のための不確実性認識エージェントを提案する。
論文 参考訳(メタデータ) (2025-09-02T15:12:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。