論文の概要: Why Model Selection Fails in Time Series Forecasting: An Empirical Study of Instability Across Data Regimes
- arxiv url: http://arxiv.org/abs/2605.01608v1
- Date: Sat, 02 May 2026 21:19:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.849012
- Title: Why Model Selection Fails in Time Series Forecasting: An Empirical Study of Instability Across Data Regimes
- Title(参考訳): 時系列予測におけるモデル選択が機能しない理由--データレジーム間の不安定性に関する実証的研究
- Authors: Tahir Cetin Akinci, Alfredo A. Martinez-Morales,
- Abstract要約: 時系列予測モデルは、統計学的および構造的特性の異なるデータセット間で不整合性を示すことが多い。
本稿では,データ登録記述子とモデル性能の関係を解析することにより,ルールベースのモデル選択が時系列予測で失敗する理由を考察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Time series forecasting models often exhibit inconsistent performance across datasets with varying statistical and structural properties. Despite the wide range of available forecasting techniques, it remains unclear whether model selection can be reliably guided by simple data characteristics. This paper investigates why rule-based model selection fails in time series forecasting by analyzing the relationship between data-regime descriptors and model performance. A descriptor-based framework is introduced to characterize time series using measurable properties, including trend strength, seasonality, noise level, and temporal dependence. Based on these descriptors, a rule-based selection mechanism is formulated to map data regimes to candidate forecasting models. The approach is evaluated on multiple real-world datasets across different domains and forecasting horizons. The results show that rule-based model selection achieves low accuracy, with correct model identification occurring in only a small fraction of cases. Significant discrepancies are observed between recommended and empirically optimal models, particularly in noisy and mixed regimes. Further analysis reveals that model performance is highly sensitive to both dataset characteristics and forecasting horizon, resulting in substantial ranking instability across scenarios. These findings explain why simple heuristic rules fail to generalize and demonstrate that forecasting performance cannot be reliably predicted using static, descriptor-based approaches. This study provides empirical evidence that model selection in time series forecasting is inherently context-dependent and highlights the need for more adaptive, data-driven strategies.
- Abstract(参考訳): 時系列予測モデルは、統計学的および構造的特性の異なるデータセット間で不整合性を示すことが多い。
利用可能な予測技術が広範囲にあるにもかかわらず、モデル選択が単純なデータ特性によって確実にガイドできるかどうかは不明だ。
本稿では,データ登録記述子とモデル性能の関係を解析することにより,ルールベースのモデル選択が時系列予測で失敗する理由を考察する。
傾向強度,季節性,騒音レベル,時間依存性などの測定可能な特性を用いて時系列を特徴付けるための記述子ベースのフレームワークが導入された。
これらの記述子に基づいて、ルールベースの選択機構を定式化し、データ構造を候補予測モデルにマッピングする。
このアプローチは、異なるドメインにわたる複数の実世界のデータセットで評価され、水平線を予測します。
その結果,ルールに基づくモデル選択は,少数のケースでのみ適切なモデル識別を行うことができ,精度が低いことがわかった。
特に雑音と混合状態において、推奨モデルと経験的最適モデルの間に重要な相違が観測される。
さらに分析したところ、モデルの性能はデータセットの特徴と予測水平線の両方に非常に敏感であり、シナリオ間の実質的なランキングの不安定性をもたらすことがわかった。
これらの結果は、単純なヒューリスティックルールが一般化に失敗する理由を説明し、静的な記述子ベースのアプローチを用いて予測性能を確実に予測できないことを示す。
この研究は、時系列予測におけるモデル選択が本質的に文脈依存であることを示す実証的な証拠を提供し、より適応的でデータ駆動型戦略の必要性を強調する。
関連論文リスト
- Model Correlation Detection via Random Selection Probing [62.093777777813756]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。
本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。
RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文 参考訳(メタデータ) (2025-09-29T01:40:26Z) - Estimating Time Series Foundation Model Transferability via In-Context Learning [74.65355820906355]
時系列基礎モデル(TSFM)は、大規模な事前訓練を通じて強力なゼロショット予測を提供する。
微調整は、公開データに制限のあるドメインのパフォーマンス向上に依然として不可欠である。
モデル選択をコンテキスト内学習問題として再キャストする転送可能性推定フレームワークであるTimeTicを紹介する。
論文 参考訳(メタデータ) (2025-09-28T07:07:13Z) - ARIES: Relation Assessment and Model Recommendation for Deep Time Series Forecasting [54.57031153712623]
ARIESは時系列特性とモデリング戦略の関係を評価するためのフレームワークである。
実世界の時系列に解釈可能な提案を提供することのできる,最初の深層予測モデルレコメンデータを提案する。
論文 参考訳(メタデータ) (2025-09-07T13:57:14Z) - ModelRadar: Aspect-based Forecast Evaluation [0.393259574660092]
予測モデルの評価と比較の現在のプラクティスは、パフォーマンスを1つのスコアにまとめることに重点を置いています。
この制限は、平均的な複数のレイヤ – データセット内の時間ステップ、地平線、および複数の時系列 – が関連するパフォーマンスの変動を隠蔽する、時系列予測において特に問題となる。
定常性,異常の有無,地平線予測など,多面にわたる一変量時系列予測モデルを評価するためのフレームワークであるModelRadarを提案する。
論文 参考訳(メタデータ) (2025-03-31T11:50:45Z) - Deep Non-Parametric Time Series Forecaster [19.800783133682955]
提案手法は, 予測分布のパラメトリック形式を仮定せず, 学習可能な戦略に従って実験分布からサンプリングして予測を生成する。
提案手法のグローバルバージョンを開発し,複数の時系列にまたがる情報を活用することで,サンプリング戦略を自動的に学習する。
論文 参考訳(メタデータ) (2023-12-22T12:46:30Z) - Towards a performance characteristic curve for model evaluation: an application in information diffusion prediction [2.8686437689115354]
拡散データのランダム性を定量化するために,情報エントロピーに基づくメトリクスを提案する。
次に,モデルのランダム性と予測精度の間のスケーリングパターンを同定する。
曲線の妥当性は、同じ家系の3つの予測モデルによって検証される。
論文 参考訳(メタデータ) (2023-09-18T07:32:57Z) - TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。
本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。
本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文 参考訳(メタデータ) (2022-02-07T21:37:29Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Simultaneously Reconciled Quantile Forecasting of Hierarchically Related
Time Series [11.004159006784977]
本稿では,階層間の予測の整合性を維持するために,量子レグレッション損失を最適化するフレキシブル非線形モデルを提案する。
ここで導入された理論的枠組みは、下層の微分可微分損失関数を持つ任意の予測モデルに適用できる。
論文 参考訳(メタデータ) (2021-02-25T00:59:01Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。