論文の概要: Learning When to Restart: Nonstationary Newsvendor from Uncensored to Censored Demand
- arxiv url: http://arxiv.org/abs/2509.18709v1
- Date: Tue, 23 Sep 2025 06:46:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.734785
- Title: Learning When to Restart: Nonstationary Newsvendor from Uncensored to Censored Demand
- Title(参考訳): 再起のタイミングを学習する:非定常ニューズベンダーが無検閲から無検閲へ
- Authors: Xin Chen, Jiameng Lyu, Shilin Yuan, Yuan Zhou,
- Abstract要約: 非定常ニューズベンダー問題を非パラメトリック需要モデルと非定常性の一般分布尺度に基づいて検討する。
非定常環境における学習のための新しい分布検出・再起動フレームワークを提案する。
我々のフレームワークは、非定常性の下での意思決定に実用的で、容易にデプロイでき、理論的に基礎づけられたソリューションを提供する。
- 参考スコア(独自算出の注目度): 8.20421120775615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study nonstationary newsvendor problems under nonparametric demand models and general distributional measures of nonstationarity, addressing the practical challenges of unknown degree of nonstationarity and demand censoring. We propose a novel distributional-detection-and-restart framework for learning in nonstationary environments, and instantiate it through two efficient algorithms for the uncensored and censored demand settings. The algorithms are fully adaptive, requiring no prior knowledge of the degree and type of nonstationarity, and offer a flexible yet powerful approach to handling both abrupt and gradual changes in nonstationary environments. We establish a comprehensive optimality theory for our algorithms by deriving matching regret upper and lower bounds under both general and refined structural conditions with nontrivial proof techniques that are of independent interest. Numerical experiments using real-world datasets, including nurse staffing data for emergency departments and COVID-19 test demand data, showcase the algorithms' superior and robust empirical performance. While motivated by the newsvendor problem, the distributional-detection-and-restart framework applies broadly to a wide class of nonstationary stochastic optimization problems. Managerially, our framework provides a practical, easy-to-deploy, and theoretically grounded solution for decision-making under nonstationarity.
- Abstract(参考訳): 非定常的ニューズベンダー問題を非定常的需要モデルおよび非定常性一般分布尺度に基づいて検討し、未知の非定常性と需要検閲の実践的課題に対処する。
本研究では,非定常環境における学習のための新しい分布検出・再起動フレームワークを提案する。
アルゴリズムは完全に適応的であり、非定常性の度合いや種類に関する事前の知識は必要とせず、非定常環境における急激な変化と漸進的な変化の両方を扱うための柔軟な、強力なアプローチを提供する。
我々は,本アルゴリズムに対する包括的最適性理論を,独立性のある非自明な証明手法を用いて,一般的かつ洗練された構造条件の下で,一致した上境界と下限を導出することによって確立する。
救急医療部門の看護師スタッフデータや新型コロナウイルス(COVID-19)検査需要データなど、現実のデータセットを使用した数値実験は、アルゴリズムの優れた、堅牢な経験的パフォーマンスを示している。
ニュースベンダの問題に動機付けられながら、分布検出と再起動のフレームワークは、広範囲の非定常確率最適化問題に適用されている。
管理面では、我々のフレームワークは実用的で容易にデプロイでき、理論的には非定常的な意思決定のためのソリューションを提供する。
関連論文リスト
- Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.37522020675243]
機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。
提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文 参考訳(メタデータ) (2024-10-22T10:19:27Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Privacy-preserving Federated Primal-dual Learning for Non-convex and Non-smooth Problems with Model Sparsification [51.04894019092156]
FL(Federated Learning)は,FLオーケストレーション(PS)の下でクライアント上でモデルをトレーニングする,急速に成長する領域として認識されている。
本稿では,非滑らかなFL問題に対して,新しい一次分離アルゴリズムを提案し,保証する。
その独特な洞察力のある性質とその分析も提示される。
論文 参考訳(メタデータ) (2023-10-30T14:15:47Z) - A Novel Plug-and-Play Approach for Adversarially Robust Generalization [38.72514422694518]
本稿では,MLモデルを摂動テストデータから保護するために,逆向きに堅牢なトレーニングを採用する頑健なフレームワークを提案する。
私たちの貢献は、計算学と統計学の両方の観点から見ることができます。
論文 参考訳(メタデータ) (2022-08-19T17:02:55Z) - Pessimistic Q-Learning for Offline Reinforcement Learning: Towards
Optimal Sample Complexity [51.476337785345436]
有限水平マルコフ決定過程の文脈におけるQ-ラーニングの悲観的変種について検討する。
ほぼ最適サンプル複雑性を実現するために,分散再現型悲観的Q-ラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-28T15:39:36Z) - Communication Efficient Federated Learning for Generalized Linear
Bandits [39.1899551748345]
連合学習環境下での一般化線形バンディットモデルについて検討する。
ローカルな更新とオフラインなリグレッションにオンラインのレグレッションを利用する通信効率の高いソリューションフレームワークを提案する。
我々のアルゴリズムは, 後悔とコミュニケーションの両コストにおいて, サブ線形レートが得られる。
論文 参考訳(メタデータ) (2022-02-02T15:31:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。