論文の概要: Enhancing Retail Sales Forecasting with Optimized Machine Learning Models
- arxiv url: http://arxiv.org/abs/2410.13773v1
- Date: Thu, 17 Oct 2024 17:11:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:18:49.793784
- Title: Enhancing Retail Sales Forecasting with Optimized Machine Learning Models
- Title(参考訳): 最適機械学習モデルによる小売売上高予測の強化
- Authors: Priyam Ganguly, Isha Mukherjee,
- Abstract要約: 小売売上高予測では、在庫管理と戦略的計画にとって、将来の売上を正確に予測することが不可欠である。
機械学習(ML)の最近の進歩は、より堅牢な代替手段を提供する。
この研究はML、特にランダムフォレスト(RF)、グラディエントブースティング(GB)、サポートベクター回帰(SVR)、XGBoostの力の恩恵を受けている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In retail sales forecasting, accurately predicting future sales is crucial for inventory management and strategic planning. Traditional methods like LR often fall short due to the complexity of sales data, which includes seasonality and numerous product families. Recent advancements in machine learning (ML) provide more robust alternatives. This research benefits from the power of ML, particularly Random Forest (RF), Gradient Boosting (GB), Support Vector Regression (SVR), and XGBoost, to improve prediction accuracy. Despite advancements, a significant gap exists in handling complex datasets with high seasonality and multiple product families. The proposed solution involves implementing and optimizing a RF model, leveraging hyperparameter tuning through randomized search cross-validation. This approach addresses the complexities of the dataset, capturing intricate patterns that traditional methods miss. The optimized RF model achieved an R-squared value of 0.945, substantially higher than the initial RF model and traditional LR, which had an R-squared of 0.531. The model reduced the root mean squared logarithmic error (RMSLE) to 1.172, demonstrating its superior predictive capability. The optimized RF model did better than cutting-edge models like Gradient Boosting (R-squared: 0.942), SVR (R-squared: 0.940), and XGBoost (R-squared: 0.939), with more minor mean squared error (MSE) and mean absolute error (MAE) numbers. The results demonstrate that the optimized RF model excels in forecasting retail sales, handling the datasets complexity with higher accuracy and reliability. This research highlights the importance of advanced ML techniques in predictive analytics, offering a significant improvement over traditional methods and other contemporary models.
- Abstract(参考訳): 小売売上高予測では、在庫管理と戦略的計画にとって、将来の売上を正確に予測することが不可欠である。
LRのような伝統的な方法は、季節や多くの製品ファミリーを含む販売データの複雑さのために、しばしば不足する。
機械学習(ML)の最近の進歩は、より堅牢な代替手段を提供する。
この研究はML、特にランダムフォレスト(RF)、グラディエントブースティング(GB)、サポートベクトル回帰(SVR)、XGBoostのパワーの恩恵を受け、予測精度を向上させる。
進歩にもかかわらず、季節性が高く、複数の製品ファミリを持つ複雑なデータセットを扱う際に、大きなギャップが存在する。
提案手法はRFモデルの実装と最適化を伴い、ランダムな探索クロスバリデーションによるハイパーパラメータチューニングを利用する。
このアプローチはデータセットの複雑さに対処し、従来のメソッドが見逃す複雑なパターンをキャプチャする。
最適化されたRFモデルは、最初のRFモデルと0.531のR二乗を持つ従来のLRよりもかなり高い0.945のR二乗値を達成した。
このモデルは、ルート平均二乗対数誤差(RMSLE)を1.172に削減し、その優れた予測能力を示した。
最適化されたRFモデルはGradient Boosting (R-squared: 0.942), SVR (R-squared: 0.940), XGBoost (R-squared: 0.939), より小さな平均二乗誤差 (MSE) と平均絶対誤差 (MAE) といった最先端モデルよりも優れていた。
その結果、最適化されたRFモデルは小売販売予測に優れ、データセットの複雑さを高い精度と信頼性で処理することを示した。
この研究は、予測分析における高度なML技術の重要性を強調し、従来の手法や他の現代モデルよりも大幅に改善されている。
関連論文リスト
- Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。
限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - Enhancing Microgrid Performance Prediction with Attention-based Deep Learning Models [0.0]
本研究の目的は、グリッド不安定性に寄与する電力振動を特徴とするマイクログリッドシステムの運用上の課題に対処することである。
畳み込みとGRU(Gated Recurrent Unit)の強みを活かした統合戦略が提案されている。
このフレームワークは、包括的な負荷予測を行うMulti-Layer Perceptron(MLP)モデルによって固定されている。
論文 参考訳(メタデータ) (2024-07-20T21:24:11Z) - Machine Learning-Driven Optimization of TPMS Architected Materials Using Simulated Annealing [0.0]
本研究は,3周期最小表面(TPMS)構造の引張応力を機械学習とシミュレートアニーリング(SA)により最適化する新しい手法を提案する。
本研究は, TPMSモデルの有限要素解析から得られたデータセットを用いて, 応力予測におけるランダムフォレスト, 決定木およびXGBoostモデルの性能を評価する。
論文 参考訳(メタデータ) (2024-05-28T05:06:37Z) - PUMA: margin-based data pruning [51.12154122266251]
モデル分類境界からの距離(すなわちマージン)に基づいて、いくつかのトレーニングサンプルを除去するデータプルーニングに焦点を当てる。
我々は,DeepFoolを用いてマージンを算出する新しいデータプルーニング戦略PUMAを提案する。
PUMAは,現状の最先端手法であるロバスト性の上に利用でき,既存のデータプルーニング戦略と異なり,モデル性能を著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2024-05-10T08:02:20Z) - Integrating Marketing Channels into Quantile Transformation and Bayesian Optimization of Ensemble Kernels for Sales Prediction with Gaussian Process Models [0.0]
本研究では,Rational Basis Function (RBF), Rational Quadratic, Mat'ern kernelsを統合したアンサンブルカーネルを用いた革新的なガウスプロセス(GP)モデルを提案する。
ベイズ最適化を適用することで、各カーネルの最適な重み付けを効率的に見つけることができ、複雑な販売データパターンを扱うモデルの能力を高めることができる。
我々のアプローチは従来のGPモデルよりも優れており、Mean Squared Error (MSE)、Mean Absolute Error (MAE)、Root Mean Squared Error (RMSE)、Coefficient of determined (R2)といった主要な指標に対して98%の精度と優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-04-15T00:11:01Z) - RVRAE: A Dynamic Factor Model Based on Variational Recurrent Autoencoder
for Stock Returns Prediction [5.281288833470249]
RVRAEは、市場データの時間的依存関係とノイズに対処する確率論的アプローチである。
揮発性株式市場のリスクモデリングに長けており、潜在空間分布からのばらつきを推定し、リターンを予測する。
論文 参考訳(メタデータ) (2024-03-04T21:48:32Z) - Scaling Relationship on Learning Mathematical Reasoning with Large
Language Models [75.29595679428105]
本研究では,事前学習損失,教師付きデータ量,拡張データ量が教師付きLDMの推論性能に与える影響について検討する。
複数のモデルからの拒絶サンプルは、LLaMA-7BをGSM8Kの49.3%の精度に押し上げ、監督された微調整(SFT)の精度を35.9%上回る結果となった。
論文 参考訳(メタデータ) (2023-08-03T15:34:01Z) - Precision-Recall Divergence Optimization for Generative Modeling with
GANs and Normalizing Flows [54.050498411883495]
本研究では,ジェネレーティブ・アドバイサル・ネットワークや正規化フローなどの生成モデルのための新しいトレーニング手法を開発した。
指定された精度-リコールトレードオフを達成することは、textitPR-divergencesと呼ぶ家族からのユニークな$f$-divergenceを最小化することを意味する。
当社のアプローチは,ImageNetなどのデータセットでテストした場合の精度とリコールの両面で,BigGANのような既存の最先端モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-05-30T10:07:17Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。