論文の概要: Designing a double deep reinforcement learning selection tool for resilient demand prediction
- arxiv url: http://arxiv.org/abs/2605.04068v1
- Date: Sun, 12 Apr 2026 18:52:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 06:56:26.560235
- Title: Designing a double deep reinforcement learning selection tool for resilient demand prediction
- Title(参考訳): 弾力性需要予測のための二重強化学習ツールの設計
- Authors: Bilel Abderrahmane Benziane, Benoit Lardeux, Ayoub Mcharek, Maher Jridi,
- Abstract要約: 本研究は,自動予測モデル選択を強化することを目的としている。
二重強化学習エージェントとして機能し、予測委員会から予測モデルを自動的に選択する。
トレーニング時間を短縮するために、平均報酬収束に基づく新しいアーリーストッピングアプローチが導入された。
- 参考スコア(独自算出の注目度): 0.6766416093990317
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of artificial intelligence in supply chain forecasting has attracted many scientific studies for several decades. However, the process of selecting an appropriate forecasting solution becomes a daunting task. This complexity arises due to the distinct features inherent to each dataset. Research to tackle this issue has been performed since the eighties but recent development of demand forecasting has opened new perspectives. This research aims to enhance automatic forecasting model selection by proposing a novel architecture that acts as a double deep reinforcement learning agent, selecting automatically a forecasting model from the forecasting committee at the time of prediction. Moreover, a novel early-stopping approach based on average reward convergence has been introduced to expedite training time. To evaluate the model's performance, an empirical study was conducted utilizing grocery sales datasets and snack demands datasets. The experimental results demonstrate the robustness of the proposed approach when compared to state-of-the-art methods.
- Abstract(参考訳): サプライチェーン予測における人工知能の利用は、数十年にわたって多くの科学的研究を惹きつけてきた。
しかし、適切な予測解を選択するプロセスは大変な作業となる。
この複雑さは、各データセット固有の特徴によって生じる。
この問題に対処する研究は80年代から行われているが、近年の需要予測の進展により新たな視点が開けている。
本研究では、二重強化学習エージェントとして機能する新しいアーキテクチャを提案し、予測時に予測委員会から予測モデルを自動的に選択することにより、自動予測モデル選択を強化することを目的とする。
さらに、トレーニング時間を短縮するために、平均報酬収束に基づく新しいアーリーストッピング手法が導入された。
モデルの性能を評価するために,食料品販売データセットとスナック需要データセットを用いた実証的研究を行った。
実験により, 最先端手法と比較して, 提案手法のロバスト性を示した。
関連論文リスト
- Learning to Predict Future-Aligned Research Proposals with Language Models [59.79457676644722]
我々は目標から得られた17,771の論文とそれらの事前カットオフ引用の時間一貫性のあるデータセットを構築した。
モデルをトレーニングするために、ターゲットとそれらのカットオフ前の引用から17,771枚のタイム一貫性のあるデータセットを構築します。
Llama-3.1 と Qwen2.5 のモデル全体で、将来のアライメントチューニングは、非アライメントベースラインに対する将来のアライメントを改善する。
論文 参考訳(メタデータ) (2026-03-28T05:41:15Z) - Cast-R1: Learning Tool-Augmented Sequential Decision Policies for Time Series Forecasting [22.256909587855905]
本稿では,予測を逐次決定問題として再構成する学習時系列予測フレームワークであるCast-R1を提案する。
Cast-R1はメモリベースの状態管理機構を導入し、インタラクションステップ間の決定関連情報を維持する。
この定式化に基づいて、予測はツール拡張エージェントワークフローを通じて実行される。
論文 参考訳(メタデータ) (2026-02-14T14:27:08Z) - Position: Beyond Model-Centric Prediction -- Agentic Time Series Forecasting [49.05788441962762]
エージェント時系列予測(ATSF)は,認識,計画,行動,反射,記憶からなるエージェントプロセスとして再編成される。
ワークフローに基づく設計、エージェント強化学習、ハイブリッドエージェントワークフローパラダイムという3つの代表的な実装パラダイムを概説し、モデル中心の予測からエージェント予測に移行する際に生じる機会と課題について議論する。
論文 参考訳(メタデータ) (2026-02-02T08:01:11Z) - Demystifying Data-Driven Probabilistic Medium-Range Weather Forecasting [63.8116386935854]
最先端の確率的スキルは、複雑なアーキテクチャ制約や専門的な訓練を必要としないことを実証する。
直下型遅延空間と履歴条件付きローカルプロジェクタを組み合わせることで,マルチスケールの大気力学を学習するためのスケーラブルなフレームワークを提案する。
我々のフレームワーク設計は確率的推定器の選択に頑健であり、補間、拡散モデル、CRPSに基づくアンサンブルトレーニングをシームレスにサポートする。
論文 参考訳(メタデータ) (2026-01-26T03:52:16Z) - Spatiotemporal Forecasting as Planning: A Model-Based Reinforcement Learning Approach with Generative World Models [45.523937630646394]
本研究では,モデルベース強化学習における新たなパラダイムであるSFP予測・アズ・プランニング(SFP)を提案する。
SFPは、多様な高時間将来の状態をシミュレートし、「想像に基づく」環境シミュレーションを可能にする新しい世界モデルを構築している。
論文 参考訳(メタデータ) (2025-10-05T03:57:38Z) - Risk Analysis and Design Against Adversarial Actions [1.9573380763700716]
本稿では,多種多様なタイプや強度の攻撃に対するモデルの堅牢性を評価するための,多種多様で先進的なフレームワークを提案する。
その結果、追加のテストデータを必要としないモデル脆弱性の評価が可能になり、配布不要のセットアップで運用される。
論文 参考訳(メタデータ) (2025-05-02T09:16:44Z) - AALF: Almost Always Linear Forecasting [3.336367986372977]
我々は、単純なモデルはたいていの場合十分良いものであり、少数の重要な予測に対してのみDeep Learningメソッドを選択することで、予測性能を改善することができると論じる。
実世界の様々なデータセットに関する実証的研究により、我々の選択手法は、ほとんどの場合、最先端のオンラインモデル選択手法に匹敵する性能を示した。
ほぼ常に単純な自己回帰線形モデルを選択して、結果の競合性能を予測できることが分かる。
論文 参考訳(メタデータ) (2024-09-16T10:13:09Z) - ReAugment: Model Zoo-Guided RL for Few-Shot Time Series Augmentation and Forecasting [74.00765474305288]
本稿では,時系列データ拡張のための強化学習(RL)の試験的検討を行う。
我々の手法であるReAugmentは、トレーニングセットのどの部分が拡張されるべきか、どのように拡張を行うべきか、RLがプロセスにどのような利点をもたらすのか、という3つの重要な問題に取り組む。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - An Empirical Study on Distribution Shift Robustness From the Perspective
of Pre-Training and Data Augmentation [91.62129090006745]
本稿では,事前学習とデータ拡張の観点から分布シフト問題を考察する。
我々は,事前学習とデータ拡張に焦点を当てた,最初の総合的な実証的研究を行った。
論文 参考訳(メタデータ) (2022-05-25T13:04:53Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Profit-oriented sales forecasting: a comparison of forecasting
techniques from a business perspective [3.613072342189595]
本稿では,コカ・コーラ社の産業界データと公開データセットの両方から成る35回連続のテクニックを比較検討する。
モデル構築と評価プロセスの両方において、テクニックが生成できる期待される利益を考慮に入れた、新しく完全に自動化された利益主導のアプローチを導入します。
論文 参考訳(メタデータ) (2020-02-03T14:50:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。