論文の概要: How Far Do Time Series Foundation Models Paint the Landscape of Real-World Benchmarks ?
- arxiv url: http://arxiv.org/abs/2509.26347v1
- Date: Tue, 30 Sep 2025 14:53:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:45:00.173936
- Title: How Far Do Time Series Foundation Models Paint the Landscape of Real-World Benchmarks ?
- Title(参考訳): 時系列モデルが現実世界のベンチマークの風景を描くのはどこまでか?
- Authors: Lujun Li, Lama Sleem, Yiqun Wang, Yangjie Xu, Niccolò Gentile, Radu State,
- Abstract要約: 本研究は,実世界の映像から時間信号を取り出すことによって,合成データと現実データを橋渡しする新しいベンチマーク手法を提案する。
実世界のビデオから派生した多種多様な時系列をキャプチャする新しいデータセットであるREAL-V-TSFMを紹介する。
- 参考スコア(独自算出の注目度): 13.776161145405496
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent evaluations of time-series foundation models (TSFMs) have emphasized synthetic benchmarks, leaving real-world generalization less thoroughly examined. This work proposes a novel benchmarking approach that bridges synthetic and realistic data by extracting temporal signals from real-world video using optical flow and curating datasets reflecting everyday temporal dynamics. Building upon this pipeline, we introduce REAL-V-TSFM, a novel dataset designed to capture rich and diverse time series derived from real-world videos. Experimental results on three state-of-the-art of TSFMs under zero-shot forecasting shows that, despite strong performance on conventional benchmarks, these models predominantly exhibit performance degradation on the proposed dataset, indicating limited generalizability in these foundation models. These findings highlight the urgent need for data-centric benchmarking and diverse model structure to advance TSFMs toward genuine universality, while further validating the effectiveness of our video-based time series data extraction pipeline.
- Abstract(参考訳): 時系列基礎モデル (TSFM) の最近の評価は, 実世界の一般化を徹底的に検討しないまま, 合成ベンチマークを強調している。
本研究は,光学的フローを用いて実世界の映像から時間的信号を抽出し,日常の時間的ダイナミクスを反映したデータセットをキュレートすることで,合成および現実的なデータをブリッジする新しいベンチマーク手法を提案する。
このパイプライン上に構築されたREAL-V-TSFMは、現実世界のビデオから派生した多種多様な時系列をキャプチャする新しいデータセットである。
ゼロショット予測下でのTSFMの最先端3つの実験結果から,従来のベンチマークの性能は高いが,提案したデータセットの性能劣化が主な要因であり,基礎モデルの一般化性に限界があることが示唆された。
これらの知見は、TSFMを真の普遍性に向けて進める上で、データ中心のベンチマークと多様なモデル構造の必要性を浮き彫りにして、ビデオベースの時系列データ抽出パイプラインの有効性をさらに検証した。
関連論文リスト
- Estimating Time Series Foundation Model Transferability via In-Context Learning [74.65355820906355]
時系列基礎モデル(TSFM)は、大規模な事前訓練を通じて強力なゼロショット予測を提供する。
微調整は、公開データに制限のあるドメインのパフォーマンス向上に依然として不可欠である。
モデル選択をコンテキスト内学習問題として再キャストする転送可能性推定フレームワークであるTimeTicを紹介する。
論文 参考訳(メタデータ) (2025-09-28T07:07:13Z) - ARIES: Relation Assessment and Model Recommendation for Deep Time Series Forecasting [54.57031153712623]
ARIESは時系列特性とモデリング戦略の関係を評価するためのフレームワークである。
実世界の時系列に解釈可能な提案を提供することのできる,最初の深層予測モデルレコメンデータを提案する。
論文 参考訳(メタデータ) (2025-09-07T13:57:14Z) - MAWIFlow Benchmark: Realistic Flow-Based Evaluation for Network Intrusion Detection [47.86433139298671]
本稿では,MAWILAB v1.1データセットから得られたフローベースベンチマークであるMAWIFlowを紹介する。
得られたデータセットは、2011年1月、2016年、2021年に太平洋横断のバックボーンのトラフィックから引き出された、時間的に異なるサンプルで構成されている。
決定木、ランダムフォレスト、XGBoost、ロジスティック回帰を含む伝統的な機械学習手法は、CNN-BiLSTMアーキテクチャに基づいたディープラーニングモデルと比較される。
論文 参考訳(メタデータ) (2025-06-20T14:51:35Z) - On the Power of Heuristics in Temporal Graphs [2.5957835343537266]
データセット間の信頼度と人気度の影響を定量化するメトリクスを導入します。
その結果、公正な比較を可能にし、より堅牢な時間グラフモデルの開発を促進するための洗練された評価手法の重要性を強調した。
論文 参考訳(メタデータ) (2025-02-07T13:28:31Z) - Evaluating Time Series Foundation Models on Noisy Periodic Time Series [0.0]
本稿では,雑音周期時系列を構成する2つのデータセットに対して,時系列基礎モデル(TSFM)の性能を評価する実験的検討を行った。
以上の結果から, TSFMは, 周期が制限された時系列に対して, より長い時間, 高い雑音レベル, サンプリング率, より複雑な時系列形状で予測能力が低下することが示唆された。
論文 参考訳(メタデータ) (2025-01-01T16:36:21Z) - Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - LTSM-Bundle: A Toolbox and Benchmark on Large Language Models for Time Series Forecasting [69.33802286580786]
LTSM-Bundleは総合的なツールボックスであり、LTSMをトレーニングするためのベンチマークである。
複数の次元からLTSMをモジュール化し、ベンチマークし、プロンプト戦略、トークン化アプローチ、ベースモデルの選択、データ量、データセットの多様性を含む。
実験により、この組み合わせは最先端のLTSMや従来のTSF法と比較して、ゼロショットと少数ショットのパフォーマンスが優れていることが示された。
論文 参考訳(メタデータ) (2024-06-20T07:09:19Z) - TEMPO: Prompt-based Generative Pre-trained Transformer for Time Series Forecasting [24.834846119163885]
本稿では,時系列表現を効果的に学習できる新しいフレームワークTEMPOを提案する。
TEMPOは、様々な領域のデータから現実世界の時間現象を動的にモデル化する機能を拡張する。
論文 参考訳(メタデータ) (2023-10-08T00:02:25Z) - A Multi-Channel Neural Graphical Event Model with Negative Evidence [76.51278722190607]
イベントデータセットは、タイムライン上で不規則に発生するさまざまなタイプのイベントのシーケンスである。
基礎となる強度関数を推定するために,非パラメトリックディープニューラルネットワーク手法を提案する。
論文 参考訳(メタデータ) (2020-02-21T23:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。