論文の概要: TSFMAudit: Data Contamination Auditing in Forecasting Time Series Foundation Models
- arxiv url: http://arxiv.org/abs/2605.26161v1
- Date: Sun, 24 May 2026 14:59:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.20691
- Title: TSFMAudit: Data Contamination Auditing in Forecasting Time Series Foundation Models
- Title(参考訳): TSFMAudit: 時系列基礎モデルの予測におけるデータ汚染監査
- Authors: Hongkai Li, Shifeng Xie, Lefei Shen, Zhuo Li, Mouxiang Chen, Xiaobin Zhang, Han Fu, Jianling Sun, Xiaoxue Ren, Chenghao Liu,
- Abstract要約: 時系列基礎モデル(TSFM)は、大規模なコーパスで事前訓練されることが多くなり、事前訓練中に評価データセットが露出した可能性があるという懸念が高まっている。
本研究は, TSFMの事前汚染監査に関する最初の研究である。
本研究では、プローブ適応力学に基づくTSFMAuditを提案する。
- 参考スコア(独自算出の注目度): 32.44501022690373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time series foundation models (TSFMs) are increasingly pretrained on large corpora, raising concerns that evaluation datasets may have been exposed during pretraining and thus yield overly optimistic performance estimates. Auditing such contamination is challenging in time series because signals are continuous and heterogeneous, and often lack corpus documentation. To the best of our knowledge, this is the first work to study pretraining contamination auditing for TSFMs. We formalize the problem of pretraining contamination auditing for TSFMs and propose TSFMAudit, a method based on probe adaptation dynamics. Our key intuition is that contamination manifests as unusually efficient adaptation: after a fine tuning probe, contaminated datasets tend to exhibit faster loss reduction with smaller backbone movement. We evaluate TSFMAudit on 6 TSFMs and 187 datasets using documented training source evidence as supervision, and compare against 10 competitive baselines adapted from the LLM literature.
- Abstract(参考訳): 時系列基礎モデル(TSFM)は、大規模なコーパスで事前訓練されることが多くなり、事前訓練中に評価データセットが露出した可能性があるという懸念が高まり、過度に楽観的な性能推定が得られる。
信号は連続的で不均一であり、しばしばコーパスの文書がないため、時系列でそのような汚染を監査することは困難である。
我々の知る限りでは、TSFMの汚染監査を事前訓練する最初の研究である。
我々は、TSFMの汚染監査の事前訓練の問題を定式化し、プローブ適応力学に基づくTSFMAuditを提案する。
我々の重要な直感は、汚染が異常に効率的な適応として現れることである: 微調整プローブの後、汚染されたデータセットは、背骨の動きを小さくすることで、より速く損失を減少させる傾向にある。
我々は,6つのTSFMと187のデータセットに対して,文書化されたトレーニングソースエビデンスを監督としてTSFMAuditを評価し,LLM文献から適応した10の競争ベースラインと比較した。
関連論文リスト
- Frequentist Consistency of Prior-Data Fitted Networks for Causal Inference [49.70323515651261]
先行データ適合ネットワーク(PFN)に基づく基礎モデルは因果推論において強い経験的性能を示した。
PFNに基づく因果推定器が古典的頻繁な推定器と整合した不確実な定量化を提供するかどうかは不明である。
論文 参考訳(メタデータ) (2026-03-12T15:14:35Z) - The Impact of Post-training on Data Contamination [5.868569999949525]
汚染は、継続した事前トレーニングによって徐々に減少するパフォーマンススパイクを引き起こす。
SFTとGRPOはどちらも漏洩した情報を再浮上させたが、外部の妥当性は異なっていた。
RLベースのポストトレーニングは、免疫性はないが、汚染に関連する過度な推定問題を緩和するのに役立つ。
論文 参考訳(メタデータ) (2026-01-03T00:21:39Z) - A Comparative Study of Adaptation Strategies for Time Series Foundation Models in Anomaly Detection [0.0]
時系列基礎モデル(TSFM)は、大きな異種データに基づいて事前訓練される。
我々は、ゼロショット推論、フルモデル適応、パラメータ効率の微調整戦略を比較した。
これらの結果は、TSFMをスケーラブルで効率的な時系列異常検出のための有望な汎用モデルとして位置づけている。
論文 参考訳(メタデータ) (2026-01-01T19:11:33Z) - Are Time Series Foundation Models Susceptible to Catastrophic Forgetting? [2.692427265051276]
Time Series Foundation Models (TSFMs) は様々な予測タスクにまたがるゼロショットの一般化を約束している。
複数のデータセットに対して逐次微調整を行った場合,TSFMが破滅的忘れを負う程度について検討した。
論文 参考訳(メタデータ) (2025-10-01T12:14:34Z) - Automated Tuning for Diffusion Inverse Problem Solvers without Generative Prior Retraining [4.511561231517167]
拡散/スコアベースのモデルは、逆問題を解決するための強力な生成前駆体として現れてきた。
本稿では,任意のノイズスケジュールで忠実度重みを調整するテスト時間最適化手法であるZero-shot Adaptive Diffusion Smpling (ZADS)を提案する。
ZADSは、従来の圧縮センシングと最近の拡散ベースの手法の両方より一貫して優れている。
論文 参考訳(メタデータ) (2025-09-11T22:22:32Z) - Are Time-Series Foundation Models Deployment-Ready? A Systematic Study of Adversarial Robustness Across Domains [23.9530536685668]
Time Series Foundation Models (TSFM) は、大規模でクロスドメインなデータに基づいて事前訓練されており、さらなるトレーニングをすることなく、新しいシナリオでゼロショット予測を行うことができる。
TSFMは逆入力摂動に対して堅牢か?
これらの摂動は、中間者攻撃やデータ中毒に利用することができる。
論文 参考訳(メタデータ) (2025-05-26T01:24:11Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Understanding and Mitigating the Label Noise in Pre-training on
Downstream Tasks [91.15120211190519]
本稿では、事前学習データセットにおけるノイズの性質を理解し、下流タスクへの影響を軽減することを目的とする。
雑音の悪影響を軽減するために特徴空間に適応する軽量ブラックボックスチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2023-09-29T06:18:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。