論文の概要: A Computational Method for Solving the Stochastic Joint Replenishment Problem in High Dimensions
- arxiv url: http://arxiv.org/abs/2511.11830v1
- Date: Fri, 14 Nov 2025 19:45:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.331661
- Title: A Computational Method for Solving the Stochastic Joint Replenishment Problem in High Dimensions
- Title(参考訳): 高次元における確率的関節補充問題の解法
- Authors: Barış Ata, Wouter van Eekelen, Yuan Zhong,
- Abstract要約: 本研究では,高次元関節補充問題に対する離散時間定式化について考察する。
我々は、インパルス制御問題を解決するために、ディープニューラルネットワークに依存する新しいシミュレーションベースの計算手法を開発した。
これまでの調査では、私たちのメソッドは最高のベンチマークにマッチするか、打ち負かしている。
- 参考スコア(独自算出の注目度): 1.9266519234757205
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider a discrete-time formulation for a class of high-dimensional stochastic joint replenishment problems. First, we approximate the problem by a continuous-time impulse control problem. Exploiting connections among the impulse control problem, backward stochastic differential equations (BSDEs) with jumps, and the stochastic target problem, we develop a novel, simulation-based computational method that relies on deep neural networks to solve the impulse control problem. Based on that solution, we propose an implementable inventory control policy for the original (discrete-time) stochastic joint replenishment problem, and test it against the best available benchmarks in a series of test problems. For the problems studied thus far, our method matches or beats the best benchmark we could find, and it is computationally feasible up to at least 50 dimensions -- that is, 50 stock-keeping units (SKUs).
- Abstract(参考訳): 本研究では,高次元確率的関節補充問題に対する離散時間定式化について考察する。
まず、この問題を連続時間インパルス制御問題により近似する。
インパルス制御問題,跳躍による後方確率微分方程式 (BSDEs) および確率的対象問題の間の接続を爆発させることにより,インパルス制御問題の解法として深層ニューラルネットワークを用いた新しいシミュレーションベース計算法を開発した。
そこで本研究では,従来の(離散時間)確率的連成補充問題に対して実装可能な在庫管理ポリシを提案し,一連のテスト問題において最高のベンチマークに対して検証する。
これまでの研究では、私たちの手法は最高のベンチマークと一致したり、打ち負かしたりし、少なくとも50次元(SKU)まで計算可能になります。
関連論文リスト
- Mean-Field Generalisation Bounds for Learning Controls in Stochastic Environments [2.8369308760896086]
古典的な離散時間制御問題の定式化について考察する。
提案手法は,システムの大部分を制御できないような,そのような問題の自然構造を利用する。
論文 参考訳(メタデータ) (2025-08-21T23:24:16Z) - Single-loop Algorithms for Stochastic Non-convex Optimization with Weakly-Convex Constraints [49.76332265680669]
本稿では、目的関数と制約関数の両方が弱凸である問題の重要な部分集合について検討する。
既存の手法では、収束速度の遅さや二重ループ設計への依存など、しばしば制限に直面している。
これらの課題を克服するために,新しい単一ループペナルティに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-21T17:15:48Z) - An Efficient On-Policy Deep Learning Framework for Stochastic Optimal Control [14.832859803172846]
本稿では、最適制御(SOC)問題を解決するための新しいオン政治アルゴリズムを提案する。
ギルサノフの定理を利用することで、微分方程式や随伴問題解による高価なバックプロパゲーションを伴わずに、SOC対象の政治的勾配を直接計算する。
実験により,従来の手法に比べて計算速度とメモリ効率が大幅に向上した。
論文 参考訳(メタデータ) (2024-10-07T16:16:53Z) - Predicting Probabilities of Error to Combine Quantization and Early Exiting: QuEE [68.6018458996143]
本稿では,量子化と早期出口動的ネットワークを組み合わせたより一般的な動的ネットワークQuEEを提案する。
我々のアルゴリズムは、ソフトアーリーエグジットや入力依存圧縮の一形態と見なすことができる。
提案手法の重要な要素は、さらなる計算によって実現可能な潜在的な精度向上の正確な予測である。
論文 参考訳(メタデータ) (2024-06-20T15:25:13Z) - A deep learning method for solving stochastic optimal control problems driven by fully-coupled FBSDEs [1.0703175070560689]
最初にこの問題をStackelberg微分ゲーム問題(リーダー-フォロワー問題)に変換する。
ユーティリティーモデルによる投資消費問題の2つの例を計算した。
その結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-04-12T13:31:19Z) - Stochastic Control through Approximate Bayesian Input Inference [23.65155934960922]
不確実性下での最適制御は、最適化問題のためのトラクタブルソリューションの作成が困難であるため、制御の一般的な課題です。
制御問題を入力推定の1つとすることで、高度な近似推論技術を用いて統計近似を原理的かつ実用的な方法で処理することができる。
論文 参考訳(メタデータ) (2021-05-17T09:27:12Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Total Deep Variation: A Stable Regularizer for Inverse Problems [71.90933869570914]
本稿では,データ駆動型汎用全深度変動正規化器について紹介する。
コアでは、畳み込みニューラルネットワークが複数のスケールや連続したブロックで局所的な特徴を抽出する。
我々は多数の画像処理タスクに対して最先端の結果を得る。
論文 参考訳(メタデータ) (2020-06-15T21:54:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。