論文の概要: Outbound Modeling for Inventory Management
- arxiv url: http://arxiv.org/abs/2507.10890v1
- Date: Tue, 15 Jul 2025 01:10:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:02.939113
- Title: Outbound Modeling for Inventory Management
- Title(参考訳): 在庫管理のためのアウトバウンドモデリング
- Authors: Riccardo Savorgnan, Udaya Ghai, Carson Eisenach, Dean Foster,
- Abstract要約: 本研究では,顧客需要に対応するため,各在庫倉庫から供給された単位数(又は排出された単位数)を予測する問題について検討する。
実際の排水と出荷のコストは複雑な生産システムによって決定される。
本稿では, 生産システムを利用して, RL ポリシーによって誘導される対実在庫状態のドレインモデルを評価するバリデーション手法を提案する。
- 参考スコア(独自算出の注目度): 4.216093870387194
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of forecasting the number of units fulfilled (or ``drained'') from each inventory warehouse to meet customer demand, along with the associated outbound shipping costs. The actual drain and shipping costs are determined by complex production systems that manage the planning and execution of customers' orders fulfillment, i.e. from where and how to ship a unit to be delivered to a customer. Accurately modeling these processes is critical for regional inventory planning, especially when using Reinforcement Learning (RL) to develop control policies. For the RL usecase, a drain model is incorporated into a simulator to produce long rollouts, which we desire to be differentiable. While simulating the calls to the internal software systems can be used to recover this transition, they are non-differentiable and too slow and costly to run within an RL training environment. Accordingly, we frame this as a probabilistic forecasting problem, modeling the joint distribution of outbound drain and shipping costs across all warehouses at each time period, conditioned on inventory positions and exogenous customer demand. To ensure robustness in an RL environment, the model must handle out-of-distribution scenarios that arise from off-policy trajectories. We propose a validation scheme that leverages production systems to evaluate the drain model on counterfactual inventory states induced by RL policies. Preliminary results demonstrate the model's accuracy within the in-distribution setting.
- Abstract(参考訳): 本研究では,顧客需要に対応するため,各在庫倉庫から充足されたユニット数(または「乾き」)を予測し,それに伴う出荷コストを算定する問題について検討する。
実際の排水・出荷コストは、顧客の注文処理の計画と実行を管理する複雑な生産システムによって決定される。
これらのプロセスの正確なモデリングは、特に強化学習(Reinforcement Learning, RL)を用いて制御ポリシーを開発する場合、地域在庫計画において重要である。
RLのユースケースでは、長いロールアウトを生成するために、ドレインモデルがシミュレータに組み込まれています。
内部のソフトウェアシステムへのコールをシミュレートすることで、この移行を回復できますが、RLトレーニング環境で実行するには微分不可能で、遅すぎてコストがかかります。
そこで我々は,これを確率的予測問題とみなし,在庫配置や外因性顧客需要に配慮した,各倉庫におけるアウトバウンドドレインと運送コストの連立分布をモデル化した。
RL環境におけるロバスト性を確保するために、モデルは、オフ・ポリティクス・トラジェクトリから生じるアウト・オブ・ディストリビューションシナリオを扱わなければならない。
本稿では, 生産システムを利用して, RL ポリシーによって誘導される対実在庫状態のドレインモデルを評価するバリデーション手法を提案する。
予備的な結果は、分布内設定におけるモデルの精度を示す。
関連論文リスト
- Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - Learning an Inventory Control Policy with General Inventory Arrival
Dynamics [2.3715198714015893]
本稿では,一般的な到着ダイナミクスの存在下での在庫管理方針の学習と検証の問題に対処する。
我々の知る限りでは、これは任意の到着ダイナミクスまたは順序量の任意の下流後処理を扱う最初の作業である。
論文 参考訳(メタデータ) (2023-10-26T05:49:13Z) - Enhancing Supply Chain Resilience: A Machine Learning Approach for
Predicting Product Availability Dates Under Disruption [2.294014185517203]
新型コロナウイルスのパンデミックや政治的・地域的な紛争が世界的なサプライチェーンに大きな打撃を与えている。
正確な可用性の予測は 物流運用を成功させる上で 重要な役割を担います
簡易回帰、ラッソ回帰、リッジ回帰、弾性ネット、ランダムフォレスト(RF)、グラディエントブースティングマシン(GBM)、ニューラルネットワークモデルなど、いくつかの回帰モデルを評価する。
論文 参考訳(メタデータ) (2023-04-28T15:22:20Z) - Policy Evaluation in Distributional LQR [70.63903506291383]
ランダムリターンの分布を閉形式で表現する。
この分布は有限個の確率変数で近似できることを示す。
近似回帰分布を用いて,リスク・アバースLQRに対するゼロ階ポリシー勾配アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-23T20:27:40Z) - A Generative Approach for Production-Aware Industrial Network Traffic
Modeling [70.46446906513677]
ドイツにあるTrumpf工場に配備されたレーザー切断機から発生するネットワークトラフィックデータについて検討した。
我々は、トラフィック統計を分析し、マシンの内部状態間の依存関係をキャプチャし、ネットワークトラフィックを生産状態依存プロセスとしてモデル化する。
可変オートエンコーダ(VAE)、条件付き可変オートエンコーダ(CVAE)、生成逆ネットワーク(GAN)など、様々な生成モデルの性能の比較を行った。
論文 参考訳(メタデータ) (2022-11-11T09:46:58Z) - A Modular Framework for Reinforcement Learning Optimal Execution [68.8204255655161]
我々は、最適貿易実行問題への強化学習の適用のためのモジュラーフレームワークを開発する。
このフレームワークは、異なるシミュレーション設定の実装を容易にするために、柔軟性を念頭に設計されている。
論文 参考訳(メタデータ) (2022-08-11T09:40:42Z) - Concepts and Algorithms for Agent-based Decentralized and Integrated
Scheduling of Production and Auxiliary Processes [78.120734120667]
本稿ではエージェントベースの分散型統合スケジューリング手法について述べる。
要求の一部は、線形にスケールする通信アーキテクチャを開発することである。
このアプローチは、工業的要件に基づいた例を使って説明されます。
論文 参考訳(メタデータ) (2022-05-06T18:44:29Z) - Towards Standardizing Reinforcement Learning Approaches for Stochastic
Production Scheduling [77.34726150561087]
強化学習はスケジューリングの問題を解決するのに使える。
既存の研究は、コードが利用できない複雑なシミュレーションに依存している。
から選ぶべきRLの設計の広大な配列があります。
モデル記述の標準化 - 生産セットアップとRL設計の両方 - と検証スキームは前提条件です。
論文 参考訳(メタデータ) (2021-04-16T16:07:10Z) - MUSBO: Model-based Uncertainty Regularized and Sample Efficient Batch
Optimization for Deployment Constrained Reinforcement Learning [108.79676336281211]
データ収集とオンライン学習のための新しいポリシーの継続的展開はコスト非効率か非現実的かのどちらかである。
モデルベース不確実性正規化とサンプル効率的なバッチ最適化という新しいアルゴリズム学習フレームワークを提案する。
本フレームワークは,各デプロイメントの新規で高品質なサンプルを発見し,効率的なデータ収集を実現する。
論文 参考訳(メタデータ) (2021-02-23T01:30:55Z) - Deep Controlled Learning for Inventory Control [0.0]
在庫管理への深層強化学習(DRL)の適用は、新たな分野である。
従来のDRLアルゴリズムは、もともとゲームプレイングやロボティクスといった多様な分野向けに開発されたもので、在庫管理によって引き起こされる特定の課題には適していない。
本稿では,高数値問題を対象とした新しいDRLアルゴリズムであるDeep Learning (DCL)を提案する。
論文 参考訳(メタデータ) (2020-11-30T18:53:08Z) - Intelligent Warehouse Allocator for Optimal Regional Utilization [0.0]
この倉庫配置問題に対する効率的なソリューションを構築するために、機械学習と最適化手法を使用します。
このソリューションを用いてバックテストを行い、2つの重要な指標である地域利用率(RU)と2日配達率(2DD)において大きな上昇を示すことにより、このモデルの効率性を検証する。
論文 参考訳(メタデータ) (2020-07-09T21:46:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。