論文の概要: QuitoBench: A High-Quality Open Time Series Forecasting Benchmark
- arxiv url: http://arxiv.org/abs/2603.26017v1
- Date: Fri, 27 Mar 2026 02:24:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.328799
- Title: QuitoBench: A High-Quality Open Time Series Forecasting Benchmark
- Title(参考訳): QuitoBench: 高品質なオープン時系列予測ベンチマーク
- Authors: Siqiao Xue, Zhaoyang Zhu, Wei Zhang, Rongyao Cai, Rui Wang, Yixiang Mu, Fan Zhou, Jianguo Li, Peng Di, Hang Yu,
- Abstract要約: 時系列予測は、ファイナンス、ヘルスケア、クラウドコンピューティングにおいて重要である。
時系列予測のための状態バランスのベンチマークであるtextscQuitoBenchを紹介する。
- 参考スコア(独自算出の注目度): 32.21290355342465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time series forecasting is critical across finance, healthcare, and cloud computing, yet progress is constrained by a fundamental bottleneck: the scarcity of large-scale, high-quality benchmarks. To address this gap, we introduce \textsc{QuitoBench}, a regime-balanced benchmark for time series forecasting with coverage across eight trend$\times$seasonality$\times$forecastability (TSF) regimes, designed to capture forecasting-relevant properties rather than application-defined domain labels. The benchmark is built upon \textsc{Quito}, a billion-scale time series corpus of application traffic from Alipay spanning nine business domains. Benchmarking 10 models from deep learning, foundation models, and statistical baselines across 232,200 evaluation instances, we report four key findings: (i) a context-length crossover where deep learning models lead at short context ($L=96$) but foundation models dominate at long context ($L \ge 576$); (ii) forecastability is the dominant difficulty driver, producing a $3.64 \times$ MAE gap across regimes; (iii) deep learning models match or surpass foundation models at $59 \times$ fewer parameters; and (iv) scaling the amount of training data provides substantially greater benefit than scaling model size for both model families. These findings are validated by strong cross-benchmark and cross-metric consistency. Our open-source release enables reproducible, regime-aware evaluation for time series forecasting research.
- Abstract(参考訳): 時系列予測は、ファイナンス、ヘルスケア、クラウドコンピューティングにおいて重要であるが、進歩は基本的なボトルネック、すなわち大規模で高品質なベンチマークの不足によって制約されている。
このギャップに対処するために、アプリケーション定義ドメインラベルではなく予測関連プロパティをキャプチャするために設計された、時系列予測のためのレギュラーバランスのベンチマークである \textsc{QuitoBench} を導入する。
このベンチマークは、9つのビジネスドメインにまたがるAlipayのアプリケーショントラフィックの10億ドル規模の時系列コーパスである‘textsc{Quito}上に構築されている。
深層学習,基礎モデル,統計ベースラインから232,200評価インスタンスをベンチマークし,4つの重要な知見を報告する。
(i)ディープラーニングモデルが短いコンテキスト(L=96$)で導くコンテキスト長のクロスオーバー(L=96$)であるが、基礎モデルが長いコンテキストで支配する(L \ge 576$)。
(ii)予測可能性が支配的な難易度ドライバであり、政権間のMAEギャップを3.64ドルに設定する。
三 深層学習モデルは、基礎モデルと一致するか、又は、より少ないパラメータで59ドルを超えること。
(4)トレーニングデータのスケーリングは、両方のモデルファミリのモデルサイズをスケーリングするよりも、はるかに大きなメリットをもたらします。
これらの知見は、強いクロスベンチマークとクロスメトリック整合性によって検証される。
当社のオープンソースリリースは,時系列予測研究における再現可能なレシックアウェア評価を可能にする。
関連論文リスト
- $V_{0.5}$: Generalist Value Model as a Prior for Sparse RL Rollouts [81.48669089692189]
一般値モデル(例えば$V_0.5$)は、コンテキスト内のモデル機能を明示的にエンコードすることで、事前訓練された値推定を実現する。
本稿では,このような値モデルにより予測されるベースラインと,スパースロールアウトから導出される経験的平均とを適応的に融合する$V_0.5$を提案する。
V_0.5$はGRPOとDAPOを大きく上回り、より高速な収束と約10%のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2026-03-11T14:57:41Z) - Enhancing Transformer-Based Foundation Models for Time Series Forecasting via Bagging, Boosting and Statistical Ensembles [7.787518725874443]
時系列基礎モデル(TSFM)は、時系列予測、異常検出、分類、計算のための強力な一般化とゼロショット能力を示している。
本稿では, 統計的およびアンサンブルに基づくエンハンスメント技術を用いて, 頑健さと精度を向上させる手法について検討する。
論文 参考訳(メタデータ) (2025-08-18T04:06:26Z) - Evaluation of a Foundational Model and Stochastic Models for Forecasting Sporadic or Spiky Production Outages of High-Performance Machine Learning Services [0.0]
我々は、最先端の機械学習サービスの散発的またはスパイクな生産停止を予測するために、最先端の基礎モデルを最適化する。
この分析は、各評価されたモデルが、散発的またはスパイクなイベントに対してどのように機能するかを理解するのに役立ちます。
最適なパラメータを持つモデルを用いて、6%未満の値誤差を持つ特定の根本原因の1年間の障害統計を推定する。
論文 参考訳(メタデータ) (2025-06-30T23:59:12Z) - When Does Multimodality Lead to Better Time Series Forecasting? [96.26052272121615]
このようなマルチモーダルな統合が常に利益をもたらすかどうか、どのような条件で検討する。
その結果,マルチモーダリティの利点は条件に依存していることが判明した。
我々の研究は、マルチモーダリティが予測タスクに役立つことをいつ予測できるかを理解するための厳密で定量的な基礎を提供する。
論文 参考訳(メタデータ) (2025-06-20T23:55:56Z) - Intention-Conditioned Flow Occupancy Models [80.42634994902858]
大規模な事前学習は、今日の機械学習研究のやり方を根本的に変えた。
同じフレームワークを強化学習に適用することは、RLの中核的な課題に対処するための魅力的な方法を提供するので、魅力的です。
生成AIの最近の進歩は、高度に複雑な分布をモデリングするための新しいツールを提供している。
論文 参考訳(メタデータ) (2025-06-10T15:27:46Z) - GIFT-Eval: A Benchmark For General Time Series Forecasting Model Evaluation [90.53485251837235]
時系列基礎モデルはゼロショット予測に優れ、明示的なトレーニングなしで多様なタスクを処理する。
GIFT-Evalは、多様なデータセットに対する評価を促進するための先駆的なベンチマークである。
GIFT-Evalには、144,000の時系列と17700万のデータポイントの23のデータセットが含まれている。
論文 参考訳(メタデータ) (2024-10-14T11:29:38Z) - LENS: Large Pre-trained Transformer for Exploring Financial Time Series Regularities [3.475989206546412]
金融時系列の事前学習モデルである textbfLENS を提案する。
textbfLENSは、慎重に構築されたモデルアーキテクチャを通じて、金融システムの複雑さを効果的にキャプチャする。
我々の研究は、高雑音環境下で事前学習された時系列モデルの開発に関する実践的な洞察を提供する。
論文 参考訳(メタデータ) (2024-08-19T15:59:46Z) - A Scalable and Transferable Time Series Prediction Framework for Demand
Forecasting [24.06534393565697]
時系列予測は多くのビジネス問題において最も不可欠でユビキタスなタスクの1つである。
本稿では,多種多様なアイテムの今後の需要を正確に予測できる,シンプルかつ強力なフレームワークであるフォレスティング・オーケストラ(Forchestra)を提案する。
論文 参考訳(メタデータ) (2024-02-29T18:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。