論文の概要: FreshRetailNet-50K: A Stockout-Annotated Censored Demand Dataset for Latent Demand Recovery and Forecasting in Fresh Retail
- arxiv url: http://arxiv.org/abs/2505.16319v1
- Date: Thu, 22 May 2025 07:21:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.113802
- Title: FreshRetailNet-50K: A Stockout-Annotated Censored Demand Dataset for Latent Demand Recovery and Forecasting in Fresh Retail
- Title(参考訳): FreshRetailNet-50K: フレッシュリテールにおける潜在需要回復と予測のためのストックアウトアノテート・デマンドデータセット
- Authors: Yangyang Wang, Jiawei Gu, Li Long, Xin Li, Li Shen, Zhouyu Fu, Xiangjun Zhou, Xu Jiang,
- Abstract要約: 我々は、検閲された需要推定のための最初の大規模ベンチマークであるFreshRetailNet-50Kを紹介する。
主要18都市の898店舗から、在庫イベントに微妙に注釈付けされたSKU683店舗を含む5万件の店舗・商品販売データで構成されている。
予測精度は2.73%向上し、体系的な需要過小評価を7.37%からほぼゼロに近いバイアスに下げる。
- 参考スコア(独自算出の注目度): 10.753266953465298
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate demand estimation is critical for the retail business in guiding the inventory and pricing policies of perishable products. However, it faces fundamental challenges from censored sales data during stockouts, where unobserved demand creates systemic policy biases. Existing datasets lack the temporal resolution and annotations needed to address this censoring effect. To fill this gap, we present FreshRetailNet-50K, the first large-scale benchmark for censored demand estimation. It comprises 50,000 store-product time series of detailed hourly sales data from 898 stores in 18 major cities, encompassing 863 perishable SKUs meticulously annotated for stockout events. The hourly stock status records unique to this dataset, combined with rich contextual covariates, including promotional discounts, precipitation, and temporal features, enable innovative research beyond existing solutions. We demonstrate one such use case of two-stage demand modeling: first, we reconstruct the latent demand during stockouts using precise hourly annotations. We then leverage the recovered demand to train robust demand forecasting models in the second stage. Experimental results show that this approach achieves a 2.73\% improvement in prediction accuracy while reducing the systematic demand underestimation from 7.37\% to near-zero bias. With unprecedented temporal granularity and comprehensive real-world information, FreshRetailNet-50K opens new research directions in demand imputation, perishable inventory optimization, and causal retail analytics. The unique annotation quality and scale of the dataset address long-standing limitations in retail AI, providing immediate solutions and a platform for future methodological innovation. The data (https://huggingface.co/datasets/Dingdong-Inc/FreshRetailNet-50K) and code (https://github.com/Dingdong-Inc/frn-50k-baseline}) are openly released.
- Abstract(参考訳): 商品の在庫・価格政策を導くためには、小売業にとって正確な需要推定が不可欠である。
しかし、不測の需要が体系的な政策バイアスを生み出すストックアウトの間、検閲された販売データによる根本的な課題に直面している。
既存のデータセットには、この検閲効果に対処するために必要な時間分解能とアノテーションが欠けている。
このギャップを埋めるために、検閲された需要推定のための最初の大規模ベンチマークであるFreshRetailNet-50Kを紹介する。
主要18都市の898店舗から、在庫イベントに微妙に注釈付けされたSKU683店舗を含む5万店舗の店頭販売データで構成されている。
時間ごとの株価記録は、このデータセットに特有のものであり、プロモーション割引、降水量、時間的特徴を含む豊富な文脈的共変量と組み合わせることで、既存のソリューションを超えて革新的な研究を可能にする。
まず、正確な時間的アノテーションを用いて、在庫期間中の潜在需要を再構築する。
次に、回収された需要を活用して、第2段階で堅牢な需要予測モデルをトレーニングします。
実験の結果, 予測精度は2.73 %向上し, 系統的需要過小評価を7.37 %からほぼ0 %に低減した。
FreshRetailNet-50Kは、前例のない時間的粒度と包括的な実世界の情報により、需要計算、在庫最適化、因果分析における新たな研究方向を開く。
データセットのユニークなアノテーションの品質とスケールは、小売AIの長年の制限に対処し、即時ソリューションと将来の方法論的イノベーションのためのプラットフォームを提供する。
データ(https://huggingface.co/datasets/Dingdong-Inc/FreshRetailNet-50K)とコード(https://github.com/Dingdong-Inc/frn-50k-baseline})が公開されている。
関連論文リスト
- LLMForecaster: Improving Seasonal Event Forecasts with Unstructured Textual Data [63.777637042161544]
本稿では,非構造化意味情報と文脈情報と履歴データを組み込むために,大規模言語モデルを微調整した新しい予測ポストプロセッサを提案する。
産業規模の小売アプリケーションでは, ホリデードリブン需要の急激な上昇にともなう数種類の製品に対して, 本手法が統計的に有意な改善を予測できることが実証された。
論文 参考訳(メタデータ) (2024-12-03T16:18:42Z) - F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - Job-SDF: A Multi-Granularity Dataset for Job Skill Demand Forecasting and Benchmarking [59.87055275344965]
Job-SDFは、ジョブスキルの需要予測モデルをトレーニングし、ベンチマークするために設計されたデータセットである。
2021年から2023年にかけて、中国の大手オンライン求人プラットフォームから集められた1035万件の求人広告に基づいている。
本データセットは,職業,企業,地域レベルなど,さまざまな粒度でのスキル需要予測モデルの評価を可能にする。
論文 参考訳(メタデータ) (2024-06-17T07:22:51Z) - Improved Sales Forecasting using Trend and Seasonality Decomposition
with LightGBM [9.788039182463768]
時系列上での傾向と季節成分のユニークな影響を示すための新しい尺度を提案する。
実験の結果,提案手法は精度を向上できることがわかった。
論文 参考訳(メタデータ) (2023-05-26T18:49:42Z) - Approaching sales forecasting using recurrent neural networks and
transformers [57.43518732385863]
深層学習技術を用いて,日・店・店レベルでの顧客販売予測問題に対処する3つの方法を開発した。
実験結果から,データ前処理を最小限に抑えた単純なシーケンスアーキテクチャを用いて,優れた性能を実現することができることを示す。
提案した解は約0.54の RMSLE を達成し、Kaggle コンペティションで提案された問題に対する他のより具体的な解と競合する。
論文 参考訳(メタデータ) (2022-04-16T12:03:52Z) - Reframing demand forecasting: a two-fold approach for lumpy and
intermittent demand [0.9137554315375922]
その結果,競争需要予測は,需要発生予測と需要規模推定の2つのモデルによって得られることがわかった。
本研究は,需要イベントの発生予測において,グローバル分類モデルが最善の選択であることを示す。
欧州の自動車オリジナル機器メーカーの日頃の需要に対応する516年3年間の時系列からなる現実世界のデータに関するアプローチをテストしました。
論文 参考訳(メタデータ) (2021-03-23T17:57:40Z) - Improving Sales Forecasting Accuracy: A Tensor Factorization Approach
with Demand Awareness [1.8282018606246824]
販売予測への高度時間潜在因子アプローチ(ATLAS)という新しいアプローチを提案する。
ATLASは、複数のストアや製品にまたがる単一のテンソルファクターモデルを構築することで、販売の正確かつ個別化された予測を実現する。
ATLASの利点は、Information Resource, Inc.が収集した8つの製品カテゴリデータセットで実証されている。
論文 参考訳(メタデータ) (2020-11-06T16:04:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。