論文の概要: Expectations vs. Realities: The Cost of MSE-Optimal Forecasting Under Conditional Uncertainty
- arxiv url: http://arxiv.org/abs/2606.04342v1
- Date: Wed, 03 Jun 2026 01:50:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.465448
- Title: Expectations vs. Realities: The Cost of MSE-Optimal Forecasting Under Conditional Uncertainty
- Title(参考訳): 予測対現実:条件不確実性下におけるMSE最適予測のコスト
- Authors: Riku Green, Zahraa S. Abdallah, Telmo M Silva Filho,
- Abstract要約: 多段階時系列予測(MSF)は平均二乗誤差(MSE)などのポイントワイド誤差指標を用いて一般的に評価される。
これは条件的不確実性の下では誤解を招く可能性を示し、条件的期待はより長い地平線における典型的な実効値とは無関係となる。
これにより、MSF評価における点精度と限界リアリズムの基本的なモデルに依存しないトレードオフが確立される。
- 参考スコア(独自算出の注目度): 1.2489632787815885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-step time series forecasting (MSF) is commonly evaluated using point-wise error metrics such as mean squared error (MSE), implicitly treating the conditional mean as a sufficient target. We show that this can be misleading under conditional uncertainty, where the conditional expectation becomes unrepresentative of typical realized values at longer horizons. We formalize this effect through a conditional uncertainty gap and prove that whenever this gap is nonzero, no deterministic predictor can simultaneously minimize MSE and match the marginal distribution of realized futures. This establishes a fundamental, model-agnostic trade-off between point accuracy and marginal realism in MSF evaluation. Using controlled stochastic dynamical systems and nine real-world forecasting benchmarks, we empirically characterize the resulting accuracy--realism frontier and \textbf{quantify the practical cost of MSE-only model selection}. As conditional uncertainty increases with forecast horizon, the attainable set expands into a pronounced Pareto front, separating MSE-optimal but under-dispersed predictors from methods that trade accuracy for realistic marginal variability. \textbf{Across benchmarks, we find that small relaxations in MSE ($\boldsymbol{\le 5\%}$) frequently unlock disproportionate gains in marginal realism, with median improvements of $\mathbf{17.3\%}$ and gains exceeding $\mathbf{30\%}$ in some datasets.} We further show that common forecasting strategies systematically occupy different regions of this frontier: direct multi-output predictors concentrate near the accuracy-optimal extreme, while recursive strategies and sample-based inference favors marginal realism. Together, these results expose a structural failure mode of MSE-based evaluation in long-horizon forecasting and recast strategy and inference selection as navigation of an unavoidable accuracy--realism trade-off.
- Abstract(参考訳): 多段階時系列予測(MSF)は、平均二乗誤差(MSE)などのポイントワイド誤差指標を用いて、条件平均を十分な目標として暗黙的に扱うことで、一般的に評価される。
これは条件的不確実性の下では誤解を招く可能性を示し、条件的期待はより長い地平線における典型的な実効値とは無関係となる。
我々は条件の不確実性ギャップを通じてこの効果を定式化し、このギャップがゼロでないときは常に、決定論的予測器が同時にMSEを最小化し、実現した未来の限界分布に一致することを証明した。
これにより、MSF評価における点精度と限界リアリズムの基本的なモデルに依存しないトレードオフが確立される。
制御された確率力学系と9つの実世界の予測ベンチマークを用いて、結果の精度-現実性フロンティアを実証的に特徴付ける。
予測地平線によって条件の不確かさが増加すると、達成可能な集合はパレートフロントに広がり、MSE最適だが分散されていない予測器を現実的な限界変動の精度を交換する手法から分離する。
ベンチマークの結果、MSE(\boldsymbol{\le 5\%}$)の小さな緩和は、一部のデータセットでは$\mathbf{17.3\%}$の中央値の改善と$\mathbf{30\%}$の上昇を頻繁に解き放つことが判明した。
直接多出力予測器は精度と最適極端付近に集中し,再帰的戦略とサンプルベース推論は限界リアリズムを好んでいる。
これらの結果は,MSEによる長期予測と再キャスト戦略における構造的失敗モードと,避けられない精度-現実主義トレードオフのナビゲーションとしての推論選択を明らかにする。
関連論文リスト
- Quantifying the Risk-Return Tradeoff in Forecasting [0.0]
平均予測精度は予測信頼性と同じではない。
私は、ベンチマークに対する予測損失差をリターンシリーズとして扱います。
次に、シャープ比、ソルティーノ比、オメガ比、ドローダウンベースの指標など、金融のリスク調整されたパフォーマンス指標を用いて、これらのリターンを評価する。
論文 参考訳(メタデータ) (2026-05-10T19:21:12Z) - The Illusion of Certainty: Uncertainty quantification for LLMs fails under ambiguity [48.899855816199484]
そこで本研究では,第1の曖昧な質問応答(QA)データセットであるMAQA*とAmbigQA*を紹介する。
予測分布とアンサンブルに基づく推定器は、あいまいさの下では基本的に限定的であることを示す。
論文 参考訳(メタデータ) (2025-11-06T14:46:35Z) - RDIT: Residual-based Diffusion Implicit Models for Probabilistic Time Series Forecasting [4.140149411004857]
RDITは、点推定と残差に基づく条件拡散と双方向のMambaネットワークを組み合わせたプラグアンドプレイフレームワークである。
RDITは, 強いベースラインに比べてCRPSの低下, 高速推論, カバレッジの向上を実現している。
論文 参考訳(メタデータ) (2025-09-02T14:06:29Z) - Probabilistic Scores of Classifiers, Calibration is not Enough [0.32985979395737786]
二項分類タスクでは、確率的予測の正確な表現が実世界の様々な応用に不可欠である。
本研究では,予測スコアと真の確率分布の一致を優先するアプローチを強調した。
その結果,従来の校正基準の限界が明らかとなり,重要な意思決定のための予測モデルの信頼性を損なう可能性が示唆された。
論文 参考訳(メタデータ) (2024-08-06T19:53:00Z) - Probabilistic Conformal Prediction with Approximate Conditional Validity [81.30551968980143]
本研究では,共形手法の柔軟性と条件分布の推定を組み合わせ,予測セットを生成する手法を開発した。
我々の手法は、条件付きカバレッジの観点から既存の手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2024-07-01T20:44:48Z) - SEMF: Supervised Expectation-Maximization Framework for Predicting Intervals [0.254890465057467]
Supervised expectation-Maximization Framework (SEMF)は、任意のMLモデルで予測間隔を生成するための汎用的でモデルに依存しないアプローチである。
SEMFは、所望のカバレッジ確率を維持しながら、常により狭い予測間隔を生成する。
量子(スピンボール)損失を使わずに、SEMFは勾配ブースト木やニューラルネットワークを含む点予測器を共形量子レグレッションで校正することができる。
論文 参考訳(メタデータ) (2024-05-28T13:43:34Z) - On the Variance, Admissibility, and Stability of Empirical Risk Minimization [57.63331017830154]
経験的リスク最小化(ERM: Empirical Risk Minimization)は、平均2乗誤差で最小限の最適値が得られる。
比較的軽度な仮定の下では、ERMの準最適性はその大きなバイアスによるものでなければならない。
論文 参考訳(メタデータ) (2023-05-29T15:25:48Z) - Probable Domain Generalization via Quantile Risk Minimization [90.15831047587302]
ドメインの一般化は、目に見えないテスト分布でうまく機能する予測子を求める。
我々はDGのための新しい確率的フレームワークを提案し、高い確率でよく動作する予測器を学習することを目指している。
論文 参考訳(メタデータ) (2022-07-20T14:41:09Z) - Uncertainty estimation of pedestrian future trajectory using Bayesian
approximation [137.00426219455116]
動的トラフィックシナリオでは、決定論的予測に基づく計画は信頼できない。
著者らは、決定論的アプローチが捉えられない近似を用いて予測中の不確実性を定量化する。
将来の状態の不確実性に対する降雨重量と長期予測の影響について検討した。
論文 参考訳(メタデータ) (2022-05-04T04:23:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。