論文の概要: Predicting Future Sales of Retail Products using Machine Learning
- arxiv url: http://arxiv.org/abs/2008.07779v1
- Date: Tue, 18 Aug 2020 07:36:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 20:45:37.234474
- Title: Predicting Future Sales of Retail Products using Machine Learning
- Title(参考訳): 機械学習による小売商品の将来販売予測
- Authors: Devendra Swami, Alay Dilipbhai Shah, Subhrajeet K B Ray
- Abstract要約: 本稿では,1C社が提供する日次販売データからなる時系列データセットについて検討する。
目標は、過去のデータから、来月のすべての製品およびストアの総売上を予測することだ。
XGBoostはこのデータセットよりもLSTMよりも優れていることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Techniques for making future predictions based upon the present and past
data, has always been an area with direct application to various real life
problems. We are discussing a similar problem in this paper. The problem
statement is provided by Kaggle, which also serves as an ongoing competition on
the Kaggle platform. In this project, we worked with a challenging time-series
dataset consisting of daily sales data, kindly provided by one of the largest
Russian software firms - 1C Company. The objective is to predict the total
sales for every product and store in the next month given the past data.
In order to perform forecasting for next month, we have deployed eXtreme
Gradient Boosting (XGBoost) and Long Short Term Memory (LSTM) based network
architecture to perform learning task. Root mean squared error (RMSE) between
the actual and predicted target values is used to evaluate the performance, and
make comparisons between the deployed algorithms. It has been found that
XGBoost fared better than LSTM over this dataset which can be attributed to its
relatively higher sparsity.
- Abstract(参考訳): 現在および過去のデータに基づいて将来の予測を行う技術は、常に様々な実生活問題に直接適用される領域であった。
我々は同様の問題を本論文で議論している。
問題の声明はkaggleによって提供されており、kaggleプラットフォームでの競争も継続している。
このプロジェクトでは,ロシア最大のソフトウェア企業である1c companyが提供する,日毎の販売データからなる,困難な時系列データセットの開発に取り組んでいます。
その目的は、過去のデータに基づいて、来月の各製品とストアの総売上を予測することだ。
来月の予測を行うために,我々は学習タスクを行うためのネットワークアーキテクチャであるextreme gradient boosting (xgboost) とlong short term memory (lstm) を展開した。
実際の目標値と予測された目標値の間のルート平均二乗誤差(rmse)を使用して、パフォーマンスを評価し、デプロイされたアルゴリズムの比較を行う。
XGBoostはこのデータセットよりもLSTMよりも優れていることが判明した。
関連論文リスト
- Scalable Probabilistic Forecasting in Retail with Gradient Boosted
Trees: A Practitioner's Approach [4.672665650064167]
本稿では,系列数や間欠性が少ない集約レベルでの予測を行うためのトップダウン手法を提案する。
サブサンプルによる低いレベルの直接トレーニングも、スケーリングの代替方法である。
われわれは、eコマースとブリック・アンド・モルタルの小売データセットの特徴の違いを示すことができる。
論文 参考訳(メタデータ) (2023-11-02T04:46:32Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Temporal Graph Benchmark for Machine Learning on Temporal Graphs [54.52243310226456]
テンポラルグラフベンチマーク(TGB)は、困難で多様なベンチマークデータセットのコレクションである。
各データセットをベンチマークし、共通のモデルのパフォーマンスがデータセット間で大きく異なることを発見した。
TGBは、再現可能でアクセス可能な時間グラフ研究のための自動機械学習パイプラインを提供する。
論文 参考訳(メタデータ) (2023-07-03T13:58:20Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - DSLOB: A Synthetic Limit Order Book Dataset for Benchmarking Forecasting
Algorithms under Distributional Shift [16.326002979578686]
電子取引市場において、リミットオーダーブック(LOB)は、所定のセキュリティのための様々な価格レベルで、保留中の購入/販売注文に関する情報を提供する。
近年、下流機械学習タスクの解決にLOBデータを使うことへの関心が高まっている。
論文 参考訳(メタデータ) (2022-11-17T06:33:27Z) - AnoShift: A Distribution Shift Benchmark for Unsupervised Anomaly
Detection [7.829710051617368]
本稿では,ネットワーク侵入検知のためのトラフィックデータセットである Kyoto-2006+ 上に構築された,時間とともに変化するデータを含む教師なし異常検出ベンチマークを提案する。
まず, 基本機能解析, t-SNE, および最適輸送手法を用いて, 年々の分布距離を計測する。
従来のアプローチからディープラーニングまで,さまざまなモデルでパフォーマンス劣化を検証する。
論文 参考訳(メタデータ) (2022-06-30T17:59:22Z) - Satellite Image Time Series Analysis for Big Earth Observation Data [50.591267188664666]
本稿では,機械学習を用いた衛星画像時系列解析のためのオープンソースRパッケージである sit について述べる。
本手法は, Cerrado Biome のケーススタディにより, 土地利用と土地被覆マップの精度が高いことを示す。
論文 参考訳(メタデータ) (2022-04-24T15:23:25Z) - A Comparative Study on Forecasting of Retail Sales [0.0]
Walmartの過去の売上データに関する予測モデルをベンチマークし、今後の売上を予測する。
これらのモデルを予測課題データセット(KaggleによるM5予測)に適用する。
論文 参考訳(メタデータ) (2022-03-14T04:24:29Z) - Networked Time Series Prediction with Incomplete Data [59.45358694862176]
我々は、歴史と未来の両方で欠落した値を持つ不完全なデータでトレーニングできる新しいディープラーニングフレームワークであるNetS-ImpGANを提案する。
3つの実世界のデータセットに対して、異なるパターンと欠落率で広範な実験を行う。
論文 参考訳(メタデータ) (2021-10-05T18:20:42Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。