論文の概要: M5 Competition Uncertainty: Overdispersion, distributional forecasting,
GAMLSS and beyond
- arxiv url: http://arxiv.org/abs/2107.06675v1
- Date: Wed, 14 Jul 2021 13:05:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-15 14:28:16.247287
- Title: M5 Competition Uncertainty: Overdispersion, distributional forecasting,
GAMLSS and beyond
- Title(参考訳): M5コンペティション不確実性:過分散、分布予測、GAMLSSなど
- Authors: Florian Ziel
- Abstract要約: M5コンペティションのデータは、特に需要ゼロで、非常に過分散と散発的な需要に直面している。
本稿では,このような数列データプロセスの適切な確率予測に関するモデリング問題について論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The M5 competition uncertainty track aims for probabilistic forecasting of
sales of thousands of Walmart retail goods. We show that the M5 competition
data faces strong overdispersion and sporadic demand, especially zero demand.
We discuss resulting modeling issues concerning adequate probabilistic
forecasting of such count data processes. Unfortunately, the majority of
popular prediction methods used in the M5 competition (e.g. lightgbm and
xgboost GBMs) fails to address the data characteristics due to the considered
objective functions. The distributional forecasting provides a suitable
modeling approach for to the overcome those problems. The GAMLSS framework
allows flexible probabilistic forecasting using low dimensional distributions.
We illustrate, how the GAMLSS approach can be applied for the M5 competition
data by modeling the location and scale parameter of various distributions,
e.g. the negative binomial distribution. Finally, we discuss software packages
for distributional modeling and their drawback, like the R package gamlss with
its package extensions, and (deep) distributional forecasting libraries such as
TensorFlow Probability.
- Abstract(参考訳): M5競争の不確実性トラックは、数千のウォルマート小売商品の販売の確率予測を目的としている。
M5コンペティションのデータは、特に需要ゼロの強い過分散と散発的な需要に直面している。
本稿では,このような数列データプロセスの適切な確率予測に関するモデリング問題について論じる。
残念なことに、M5コンペで使われる一般的な予測手法の大多数(例)。
Lightgbmとxgboost GBMs)は、考慮された目的関数のためにデータ特性に対処できない。
分布予測はこれらの問題を克服するための適切なモデリング手法を提供する。
GAMLSSフレームワークは、低次元分布を用いた柔軟な確率予測を可能にする。
本稿では,様々な分布の位置とスケールパラメータをモデル化することにより,m5競合データに対してgamlssアプローチを適用する方法を示す。
負の二項分布です
最後に、rパッケージgamlssとそのパッケージ拡張、tensorflow probabilityのような(深い)ディストリビューション予測ライブラリなど、分散モデリングのためのソフトウェアパッケージとその欠点について論じる。
関連論文リスト
- Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Scalable Probabilistic Forecasting in Retail with Gradient Boosted
Trees: A Practitioner's Approach [4.672665650064167]
本稿では,系列数や間欠性が少ない集約レベルでの予測を行うためのトップダウン手法を提案する。
サブサンプルによる低いレベルの直接トレーニングも、スケーリングの代替方法である。
われわれは、eコマースとブリック・アンド・モルタルの小売データセットの特徴の違いを示すことができる。
論文 参考訳(メタデータ) (2023-11-02T04:46:32Z) - Dr. FERMI: A Stochastic Distributionally Robust Fair Empirical Risk
Minimization Framework [12.734559823650887]
分散シフトが存在する場合、公正な機械学習モデルはテストデータに対して不公平に振る舞うことがある。
既存のアルゴリズムはデータへの完全なアクセスを必要とし、小さなバッチを使用する場合には使用できない。
本稿では,因果グラフの知識を必要としない収束保証付き分布安定度フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-20T23:25:28Z) - WeatherBench Probability: A benchmark dataset for probabilistic
medium-range weather forecasting along with deep learning baseline models [22.435002906710803]
WeatherBenchは、測地、温度、降水量の中距離天気予報のためのベンチマークデータセットである。
WeatherBench Probabilityはこれを確率的予測に拡張し、確立された確率的検証メトリクスのセットを追加する。
論文 参考訳(メタデータ) (2022-05-02T12:49:05Z) - Robust Nonparametric Distribution Forecast with Backtest-based Bootstrap
and Adaptive Residual Selection [14.398720944586803]
分布予測は予測の不確実性を定量化し、対応する推定確率で様々な予測シナリオを提供する。
本稿では,バックテストベースのブートストラップと適応的残差選択に依存する,実用的で堅牢な分布予測フレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-16T09:53:48Z) - CovarianceNet: Conditional Generative Model for Correct Covariance
Prediction in Human Motion Prediction [71.31516599226606]
本稿では,将来の軌道の予測分布に関連する不確かさを正確に予測する手法を提案する。
我々のアプローチであるCovariaceNetは、ガウス潜在変数を持つ条件付き生成モデルに基づいている。
論文 参考訳(メタデータ) (2021-09-07T09:38:24Z) - Predicting with Confidence on Unseen Distributions [90.68414180153897]
ドメイン適応と予測不確実性文学を結びつけて、挑戦的な未知分布のモデル精度を予測する。
分類器の予測における信頼度(DoC)の差は,様々な変化に対して,分類器の性能変化を推定することに成功した。
具体的には, 合成分布と自然分布の区別について検討し, その単純さにもかかわらず, DoCは分布差の定量化に優れることを示した。
論文 参考訳(メタデータ) (2021-07-07T15:50:18Z) - Distributed NLI: Learning to Predict Human Opinion Distributions for
Language Reasoning [76.17436599516074]
自然言語推論のための人間の判断の分布を予測することを目的としている新しいNLUタスクである分散NLIを紹介します。
本研究では,モンテカルロ(MC)Dropout,Deep Ensemble,Re-Calibration,Distribution Distillationという新たな分布推定手法を適用することで,人間の判断分布を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-04-18T01:25:19Z) - Probabilistic electric load forecasting through Bayesian Mixture Density
Networks [70.50488907591463]
確率的負荷予測(PLF)は、スマートエネルギーグリッドの効率的な管理に必要な拡張ツールチェーンの重要なコンポーネントです。
ベイジアン混合密度ネットワークを枠とした新しいPLFアプローチを提案する。
後方分布の信頼性と計算にスケーラブルな推定を行うため,平均場変動推定と深層アンサンブルを統合した。
論文 参考訳(メタデータ) (2020-12-23T16:21:34Z) - DDKSP: A Data-Driven Stochastic Programming Framework for Car-Sharing
Relocation Problem [17.440172040605354]
カーシェアリング再配置問題 (CSRP) を不確実な要求下で検討する。
この問題を解決するために、データ駆動カーネルプログラミング(DDKSP)と呼ばれる革新的なフレームワークが提案されている。
提案手法は純パラメトリックアプローチを3.72%,4.58%,11%で上回っている。
論文 参考訳(メタデータ) (2020-01-20T19:04:29Z) - Distributionally Robust Bayesian Quadrature Optimization [60.383252534861136]
確率分布が未知な分布の不確実性の下でBQOについて検討する。
標準的なBQOアプローチは、固定されたサンプル集合が与えられたときの真の期待目標のモンテカルロ推定を最大化する。
この目的のために,新しい後方サンプリングに基づくアルゴリズム,すなわち分布的に堅牢なBQO(DRBQO)を提案する。
論文 参考訳(メタデータ) (2020-01-19T12:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。