論文の概要: Predicting Future Sales of Retail Products using Machine Learning
- arxiv url: http://arxiv.org/abs/2008.07779v1
- Date: Tue, 18 Aug 2020 07:36:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 20:45:37.234474
- Title: Predicting Future Sales of Retail Products using Machine Learning
- Title(参考訳): 機械学習による小売商品の将来販売予測
- Authors: Devendra Swami, Alay Dilipbhai Shah, Subhrajeet K B Ray
- Abstract要約: 本稿では,1C社が提供する日次販売データからなる時系列データセットについて検討する。
目標は、過去のデータから、来月のすべての製品およびストアの総売上を予測することだ。
XGBoostはこのデータセットよりもLSTMよりも優れていることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Techniques for making future predictions based upon the present and past
data, has always been an area with direct application to various real life
problems. We are discussing a similar problem in this paper. The problem
statement is provided by Kaggle, which also serves as an ongoing competition on
the Kaggle platform. In this project, we worked with a challenging time-series
dataset consisting of daily sales data, kindly provided by one of the largest
Russian software firms - 1C Company. The objective is to predict the total
sales for every product and store in the next month given the past data.
In order to perform forecasting for next month, we have deployed eXtreme
Gradient Boosting (XGBoost) and Long Short Term Memory (LSTM) based network
architecture to perform learning task. Root mean squared error (RMSE) between
the actual and predicted target values is used to evaluate the performance, and
make comparisons between the deployed algorithms. It has been found that
XGBoost fared better than LSTM over this dataset which can be attributed to its
relatively higher sparsity.
- Abstract(参考訳): 現在および過去のデータに基づいて将来の予測を行う技術は、常に様々な実生活問題に直接適用される領域であった。
我々は同様の問題を本論文で議論している。
問題の声明はkaggleによって提供されており、kaggleプラットフォームでの競争も継続している。
このプロジェクトでは,ロシア最大のソフトウェア企業である1c companyが提供する,日毎の販売データからなる,困難な時系列データセットの開発に取り組んでいます。
その目的は、過去のデータに基づいて、来月の各製品とストアの総売上を予測することだ。
来月の予測を行うために,我々は学習タスクを行うためのネットワークアーキテクチャであるextreme gradient boosting (xgboost) とlong short term memory (lstm) を展開した。
実際の目標値と予測された目標値の間のルート平均二乗誤差(rmse)を使用して、パフォーマンスを評価し、デプロイされたアルゴリズムの比較を行う。
XGBoostはこのデータセットよりもLSTMよりも優れていることが判明した。
関連論文リスト
- F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - SCTc-TE: A Comprehensive Formulation and Benchmark for Temporal Event Forecasting [63.01035584154509]
私たちは完全に自動化されたパイプラインを開発し、約0.6百万のニュース記事からMidEast-TEという大規模なデータセットを構築しました。
このデータセットは、2015年から2022年まで、主に中東地域での協力と紛争イベントに焦点を当てている。
そこで本稿では,SCTc-TE予測にローカルコンテキストとグローバルコンテキストの両方を活用可能なLoGoを提案する。
論文 参考訳(メタデータ) (2023-12-02T07:40:21Z) - Scalable Probabilistic Forecasting in Retail with Gradient Boosted
Trees: A Practitioner's Approach [4.672665650064167]
本稿では,系列数や間欠性が少ない集約レベルでの予測を行うためのトップダウン手法を提案する。
サブサンプルによる低いレベルの直接トレーニングも、スケーリングの代替方法である。
われわれは、eコマースとブリック・アンド・モルタルの小売データセットの特徴の違いを示すことができる。
論文 参考訳(メタデータ) (2023-11-02T04:46:32Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Temporal Graph Benchmark for Machine Learning on Temporal Graphs [54.52243310226456]
テンポラルグラフベンチマーク(TGB)は、困難で多様なベンチマークデータセットのコレクションである。
各データセットをベンチマークし、共通のモデルのパフォーマンスがデータセット間で大きく異なることを発見した。
TGBは、再現可能でアクセス可能な時間グラフ研究のための自動機械学習パイプラインを提供する。
論文 参考訳(メタデータ) (2023-07-03T13:58:20Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - AnoShift: A Distribution Shift Benchmark for Unsupervised Anomaly
Detection [7.829710051617368]
本稿では,ネットワーク侵入検知のためのトラフィックデータセットである Kyoto-2006+ 上に構築された,時間とともに変化するデータを含む教師なし異常検出ベンチマークを提案する。
まず, 基本機能解析, t-SNE, および最適輸送手法を用いて, 年々の分布距離を計測する。
従来のアプローチからディープラーニングまで,さまざまなモデルでパフォーマンス劣化を検証する。
論文 参考訳(メタデータ) (2022-06-30T17:59:22Z) - A Comparative Study on Forecasting of Retail Sales [0.0]
Walmartの過去の売上データに関する予測モデルをベンチマークし、今後の売上を予測する。
これらのモデルを予測課題データセット(KaggleによるM5予測)に適用する。
論文 参考訳(メタデータ) (2022-03-14T04:24:29Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。