論文の概要: Zero-Training Temporal Drift Detection for Transformer Sentiment Models: A Comprehensive Analysis on Authentic Social Media Streams
- arxiv url: http://arxiv.org/abs/2512.20631v1
- Date: Sun, 30 Nov 2025 13:08:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-29 00:37:57.099617
- Title: Zero-Training Temporal Drift Detection for Transformer Sentiment Models: A Comprehensive Analysis on Authentic Social Media Streams
- Title(参考訳): 変圧器感性モデルにおけるゼロ学習時空間ドリフト検出:ソーシャルメディアストリームの総合的分析
- Authors: Aayam Bansal, Ishaan Gangwani,
- Abstract要約: 本稿では,主要な実世界のイベントから得られたソーシャルメディアデータに基づいて,トランスフォーマーに基づく感情モデルの総合的ゼロトレーニング時流解析を行う。
イベント駆動の期間において,精度低下を伴うモデル不安定性が23.4%に達することを示す。
このゼロトレーニング手法は、リアルタイムの感情監視システムの即時展開を可能にし、動的コンテンツ期間中のトランスフォーマーモデルの振る舞いに関する新たな洞察を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a comprehensive zero-training temporal drift analysis of transformer-based sentiment models validated on authentic social media data from major real-world events. Through systematic evaluation across three transformer architectures and rigorous statistical validation on 12,279 authentic social media posts, we demonstrate significant model instability with accuracy drops reaching 23.4% during event-driven periods. Our analysis reveals maximum confidence drops of 13.0% (Bootstrap 95% CI: [9.1%, 16.5%]) with strong correlation to actual performance degradation. We introduce four novel drift metrics that outperform embedding-based baselines while maintaining computational efficiency suitable for production deployment. Statistical validation across multiple events confirms robust detection capabilities with practical significance exceeding industry monitoring thresholds. This zero-training methodology enables immediate deployment for real-time sentiment monitoring systems and provides new insights into transformer model behavior during dynamic content periods.
- Abstract(参考訳): 本稿では,主要な実世界のイベントから得られたソーシャルメディアデータに基づいて,トランスフォーマーに基づく感情モデルの総合的ゼロトレーニング時流解析を行う。
3つのトランスフォーマーアーキテクチャの体系的評価と12,279の真正なソーシャルメディア投稿に対する厳密な統計的検証を通じて、イベント駆動期間中に精度が23.4%まで低下する有意なモデル不安定性を実証した。
分析の結果,信頼性の最大低下は13.0%(Bootstrap 95% CI: [9.1%, 16.5%])であり,実際のパフォーマンス劣化と強く相関していることがわかった。
そこで本研究では,本運用に適した計算効率を維持しつつ,組込みベースラインよりも優れた4つの新しいドリフト指標を提案する。
複数のイベントにわたる統計的検証により、業界監視しきい値を超える実用的重要性を持つ堅牢な検出能力が確認される。
このゼロトレーニング手法は、リアルタイムの感情監視システムの即時展開を可能にし、動的コンテンツ期間中のトランスフォーマーモデルの振る舞いに関する新たな洞察を提供する。
関連論文リスト
- Flexible Gravitational-Wave Parameter Estimation with Transformers [73.44614054040267]
本稿では,予測時間における多様な解析設定への適応を可能にする,フレキシブルトランスフォーマーベースのアーキテクチャをトレーニング戦略と組み合わせて導入する。
我々は、Dingo-T1と呼ばれる単一のフレキシブルモデルが、第3のLIGO-Virgo-KAGRA観測ランから48の重力波イベントを解析できることを実証した。
論文 参考訳(メタデータ) (2025-12-02T17:49:08Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - A Realistic Evaluation of Cross-Frequency Transfer Learning and Foundation Forecasting Models [32.56983347493999]
大規模時系列データセットを事前トレーニング基礎予測モデル(FFM)にキュレートするための一般的なフレームワークとして、クロス周波数転送学習(CFTL)が登場している。
CFTLは将来性を示しているが、現在のベンチマークプラクティスは、そのパフォーマンスを正確に評価するに足らない。
この欠点は、小規模評価データセットへの過度な依存、計算サマリ統計におけるサンプルサイズの不適切な処理、最適以下の統計モデルの報告、事前トレーニングとテストデータセット間の重複の非無視的なリスクの考慮の欠如など、多くの要因に起因している。
論文 参考訳(メタデータ) (2025-09-23T18:19:50Z) - Segmented Confidence Sequences and Multi-Scale Adaptive Confidence Segments for Anomaly Detection in Nonstationary Time Series [0.0]
我々は、SCS(Segmented Confidence Sequences)とMACS(Multi-Scale Adaptive Confidence Segments)の2つの新しい適応しきい値フレームワークを紹介し、実証的に評価する。
Wefer Manufacturingのベンチマークデータセットによる実験では、従来のパーセンタイルやローリング量子化アプローチと比較して、F1スコアの大幅な改善が見られた。
論文 参考訳(メタデータ) (2025-08-08T18:34:54Z) - MAWIFlow Benchmark: Realistic Flow-Based Evaluation for Network Intrusion Detection [47.86433139298671]
本稿では,MAWILAB v1.1データセットから得られたフローベースベンチマークであるMAWIFlowを紹介する。
得られたデータセットは、2011年1月、2016年、2021年に太平洋横断のバックボーンのトラフィックから引き出された、時間的に異なるサンプルで構成されている。
決定木、ランダムフォレスト、XGBoost、ロジスティック回帰を含む伝統的な機械学習手法は、CNN-BiLSTMアーキテクチャに基づいたディープラーニングモデルと比較される。
論文 参考訳(メタデータ) (2025-06-20T14:51:35Z) - Powerformer: A Transformer with Weighted Causal Attention for Time-series Forecasting [50.298817606660826]
我々は,非因果重みをスムーズな重み付き崩壊に応じて再加重する因果重みに置き換える新しいトランスフォーマーであるPowerformerを紹介する。
我々の実証実験の結果,Powerformer は公開時系列ベンチマークで最先端の精度を達成できた。
分析の結果、トレーニング中にモデルの局所性バイアスが増幅され、時系列データとパワールールに基づく注意の相互作用が示されることがわかった。
論文 参考訳(メタデータ) (2025-02-10T04:42:11Z) - Predictive Crash Analytics for Traffic Safety using Deep Learning [0.0]
本研究では,アンサンブル学習手法とマルチモーダルデータ融合を統合した交通安全解析手法を提案する。
我々の主な貢献は、時空間の衝突パターンと環境条件を組み合わせた階層的な重大度分類システムの開発である。
本稿では,事故発生時の位置データをインシデントレポートや気象条件と統合し,リスク予測の精度92.4%,ホットスポット識別の精度89.7%を達成できる新しい特徴工学手法を提案する。
論文 参考訳(メタデータ) (2025-02-09T05:00:46Z) - FOVAL: Calibration-Free and Subject-Invariant Fixation Depth Estimation Across Diverse Eye-Tracking Datasets [0.0]
深度推定に対するロバストなキャリブレーションフリーアプローチであるFOVALを導入する。
変換器、時空間ネットワーク(TCN)、CNNと比較して、FOVALは優れた性能を発揮する。
LOOCV(Leave-One-Out Cross-Validation)とクロスデータセットバリデーション(cross-dataset Validation)を用いた3つのベンチマークデータセットに対する評価は、平均絶対誤差(MAE)が9.1cmであり、キャリブレーションなしでの強い一般化を示している。
論文 参考訳(メタデータ) (2024-08-07T07:09:14Z) - Prediction of SLAM ATE Using an Ensemble Learning Regression Model and
1-D Global Pooling of Data Characterization [3.4399698738841553]
原位置センサの入力特性に基づいてSLAMの局所化誤差を予測する新しい手法を提案する。
提案手法は, 原位置センサデータから生成した1次元グローバルプール特徴に基づくランダム森林回帰モデルを用いた。
また,12の異なる1次元大域プール関数が回帰品質に及ぼす影響について検討し,その1次元大域平均化の優位性について定量的に検証した。
論文 参考訳(メタデータ) (2023-03-01T16:12:47Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。