論文の概要: Time Series Foundation Models for Energy Load Forecasting on Consumer Hardware: A Multi-Dimensional Zero-Shot Benchmark
- arxiv url: http://arxiv.org/abs/2602.10848v1
- Date: Wed, 11 Feb 2026 13:34:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.938141
- Title: Time Series Foundation Models for Energy Load Forecasting on Consumer Hardware: A Multi-Dimensional Zero-Shot Benchmark
- Title(参考訳): 消費者ハードウェアにおけるエネルギー負荷予測のための時系列基礎モデル:多次元ゼロショットベンチマーク
- Authors: Luigi Simeone,
- Abstract要約: Time Series Foundation Models (TSFM) はタスク固有のトレーニングを回避できるゼロショット予測機能を導入した。
本稿では,業界標準ベースラインと2つの統計基準として,Prophetとともに4つのTSFMを評価するベンチマークを提案する。
すべての実験は、コンシューマグレードのハードウェア(AMD 7, 16GB RAM、GPUなし)で実行される
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Time Series Foundation Models (TSFMs) have introduced zero-shot prediction capabilities that bypass the need for task-specific training. Whether these capabilities translate to mission-critical applications such as electricity demand forecasting--where accuracy, calibration, and robustness directly affect grid operations--remains an open question. We present a multi-dimensional benchmark evaluating four TSFMs (Chronos-Bolt, Chronos-2, Moirai-2, and TinyTimeMixer) alongside Prophet as an industry-standard baseline and two statistical references (SARIMA and Seasonal Naive), using ERCOT hourly load data from 2020 to 2024. All experiments run on consumer-grade hardware (AMD Ryzen 7, 16GB RAM, no GPU). The evaluation spans four axes: (1) context length sensitivity from 24 to 2048 hours, (2) probabilistic forecast calibration, (3) robustness under distribution shifts including COVID-19 lockdowns and Winter Storm Uri, and (4) prescriptive analytics for operational decision support. The top-performing foundation models achieve MASE values near 0.31 at long context lengths (C = 2048h, day-ahead horizon), a 47% reduction over the Seasonal Naive baseline. The inclusion of Prophet exposes a structural advantage of pre-trained models: Prophet fails when the fitting window is shorter than its seasonality period (MASE > 74 at 24-hour context), while TSFMs maintain stable accuracy even with minimal context because they recognise temporal patterns learned during pre-training rather than estimating them from scratch. Calibration varies substantially across models--Chronos-2 produces well-calibrated prediction intervals (95% empirical coverage at 90% nominal level) while both Moirai-2 and Prophet exhibit overconfidence (~70% coverage). We provide practical model selection guidelines and release the complete benchmark framework for reproducibility.
- Abstract(参考訳): Time Series Foundation Models (TSFM) はタスク固有のトレーニングを回避できるゼロショット予測機能を導入した。
これらの能力が、電力需要予測のようなミッションクリティカルなアプリケーション(精度、キャリブレーション、ロバスト性)に変換されるかどうかについては、オープンな疑問が残る。
業界標準ベースラインとしてProphetとともに4つのTSFM(Chronos-Bolt, Chronos-2, Moirai-2, TinyTimeMixer)と2つの統計基準(SARIMA, Seasonal Naive)を、2020年から2024年までの時間負荷データを用いて評価した。
すべての実験は、コンシューマグレードのハードウェア(AMD Ryzen 7, 16GB RAM、GPUなし)で実行される。
評価は,(1)24時間から2048時間までの文脈長感度,(2)確率的予測キャリブレーション,(3)新型コロナウイルスのロックダウンや冬の嵐Uriを含む分布シフト下での堅牢性,(4)運用上の意思決定支援のための規範的分析の4つにまたがる。
最高性能の基盤モデルは、長期(C = 2048h, day-ahead horizon)で0.31付近でMASE値を達成する。
預言者は、フィッティングウィンドウが季節性期間よりも短いときに失敗する(MASE > 74 at 24-hour context)が、TSFMは、スクラッチから推定するのではなく、事前トレーニング中に学んだ時間パターンを認識するため、最小限のコンテキストでも安定した精度を維持する。
キャリブレーションはモデルによって大きく異なり、クロノス-2はよく校正された予測間隔(95%が名目レベルで実証的なカバレッジ)を生成し、モイライ-2と預言者の両方が自信過剰(約70%のカバレッジ)を示す。
実際のモデル選択ガイドラインを提供し、再現性のための完全なベンチマークフレームワークをリリースする。
関連論文リスト
- Echo State Networks for Time Series Forecasting: Hyperparameter Sweep and Benchmarking [51.56484100374058]
我々は、完全に自動で純粋にフィードバック駆動のESNが、広く使われている統計的予測手法の代替となるかどうかを評価する。
予測精度は、MASEとsMAPEを用いて測定され、ドリフトや季節予測、統計モデルといった単純なベンチマークと比較される。
論文 参考訳(メタデータ) (2026-02-03T16:01:22Z) - Shapelets-Enriched Selective Forecasting using Time Series Foundation Models [4.788378233213477]
時系列基礎モデルは、複雑な時系列データをモデル化する能力により、最近多くの注目を集めている。
予測タスクの平均ゼロショット性能は高いが、データの特定の臨界領域における予測は必ずしも信頼できない。
シェープレットを用いて時系列のこれらの重要なセグメントを特定するための選択予測フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-16T22:57:24Z) - Beyond Accuracy: A Stability-Aware Metric for Multi-Horizon Forecasting [0.0]
本稿では,確率的マルチホライゾン予測の質を評価するための予測精度とコヒーレンススコア(略してACスコア)を紹介する。
その結果,従来の最大推定値よりも大幅に改善した。
論文 参考訳(メタデータ) (2026-01-15T21:26:57Z) - Swift: An Autoregressive Consistency Model for Efficient Weather Forecasting [0.8503925197267593]
我々は,確率フローモデルの自己回帰微調整を可能にする単一ステップ一貫性モデルであるSwiftを紹介する。
結果から、Swiftは75日間にわたって安定し、最先端の拡散ベースラインよりも39時間以上高速に動作する、熟練した6時間の予測を生成する。
論文 参考訳(メタデータ) (2025-09-30T00:54:24Z) - An Explainable, Attention-Enhanced, Bidirectional Long Short-Term Memory Neural Network for Joint 48-Hour Forecasting of Temperature, Irradiance, and Relative Humidity [0.0]
本稿では、スマートHVACシステムにおけるモデル予測制御(MPC)を支援するため、48時間の温度、太陽光、相対湿度の予測のためのディープラーニング(DL)フレームワークを提案する。
このアプローチでは、BiLSTM(Bidirectional Long Short-Term Memory)ネットワークに注意を払っており、3変数全てを共同で予測することで、時間的および横断的な依存関係をキャプチャする。
このモデルは、平均絶対誤差が摂氏1.3度(温度)、31W/m2(照度)、6.7%(湿度)、最先端の数値予測と機械学習ベンチマークを上回った。
論文 参考訳(メタデータ) (2025-08-28T15:40:33Z) - Output Scaling: YingLong-Delayed Chain of Thought in a Large Pretrained Time Series Forecasting Model [55.25659103706409]
このフレームワークは,設計した基盤モデルであるYingLongの最先端性能を実現する。
YingLongは、マスク付きトークンリカバリによってトレーニングされた非因果的双方向アテンションエンコーダのみのトランスフォーマーである。
我々は、6Mから3Mパラメータの4つの基礎モデルをリリースし、ゼロショットタスクにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2025-05-20T14:31:06Z) - GIFT-Eval: A Benchmark For General Time Series Forecasting Model Evaluation [90.53485251837235]
時系列基礎モデルはゼロショット予測に優れ、明示的なトレーニングなしで多様なタスクを処理する。
GIFT-Evalは、多様なデータセットに対する評価を促進するための先駆的なベンチマークである。
GIFT-Evalには、144,000の時系列と17700万のデータポイントの23のデータセットが含まれている。
論文 参考訳(メタデータ) (2024-10-14T11:29:38Z) - GraphCast: Learning skillful medium-range global weather forecasting [107.40054095223779]
我々は、再分析データから直接トレーニングできる「GraphCast」と呼ばれる機械学習ベースの手法を導入する。
全世界で10日以上、0.25度で、数百の気象変動を1分以内で予測する。
我々は,GraphCastが1380の検証対象の90%において,最も正確な運用決定システムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-24T18:15:39Z) - Sub-seasonal forecasting with a large ensemble of deep-learning weather
prediction models [6.882042556551611]
深層学習天気予報(DLWP)モデルを用いたアンサンブル予測システムを提案する。
このモデルは、立方体球格子上の畳み込みニューラルネットワーク(CNN)を用いて、グローバルな予測を生成する。
エンサンブルスプレッドは、主に32のDLWPモデルを作成するためにCNNトレーニングプロセスのランダム化によって生成される。
論文 参考訳(メタデータ) (2021-02-09T20:14:43Z) - Improving Event Duration Prediction via Time-aware Pre-training [90.74988936678723]
持続時間予測に有効な2つのモデルを提案する。
1つのモデルは、期間値が該当する範囲/単位を予測し(R−pred)、もう1つのモデルは正確な期間値E−predを予測する。
我々の最良のモデル -- E-pred は、以前の作業よりも大幅に優れ、R-pred よりも正確に持続時間情報をキャプチャします。
論文 参考訳(メタデータ) (2020-11-05T01:52:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。