Fugu-MT 論文翻訳(概要): Online Joint Assortment-Inventory Optimization under MNL Choices

論文の概要: Online Joint Assortment-Inventory Optimization under MNL Choices

arxiv url: http://arxiv.org/abs/2304.02022v1
Date: Tue, 4 Apr 2023 09:25:34 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-06 14:33:44.558291
Title: Online Joint Assortment-Inventory Optimization under MNL Choices
Title（参考訳）: MNL選択によるオンライン共同配置-在庫最適化
Authors: Yong Liang, Xiaojie Mao, Shiyuan Wang
Abstract要約: 本稿では,MNL(Multinomial Logit)選択モデルに従えば,各顧客の選択行動が従うと仮定する,オンラインジョイント・アソート・インベントリ最適化問題について考察する。本稿では,オンラインの品揃えと在庫の意思決定における探索と搾取を効果的にバランスさせる新しいアルゴリズムを提案する。
参考スコア（独自算出の注目度）: 14.530542487845732
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study an online joint assortment-inventory optimization problem, in which we assume that the choice behavior of each customer follows the Multinomial Logit (MNL) choice model, and the attraction parameters are unknown a priori. The retailer makes periodic assortment and inventory decisions to dynamically learn from the realized demands about the attraction parameters while maximizing the expected total profit over time. In this paper, we propose a novel algorithm that can effectively balance the exploration and exploitation in the online decision-making of assortment and inventory. Our algorithm builds on a new estimator for the MNL attraction parameters, a novel approach to incentivize exploration by adaptively tuning certain known and unknown parameters, and an optimization oracle to static single-cycle assortment-inventory planning problems with given parameters. We establish a regret upper bound for our algorithm and a lower bound for the online joint assortment-inventory optimization problem, suggesting that our algorithm achieves nearly optimal regret rate, provided that the static optimization oracle is exact. Then we incorporate more practical approximate static optimization oracles into our algorithm, and bound from above the impact of static optimization errors on the regret of our algorithm. At last, we perform numerical studies to demonstrate the effectiveness of our proposed algorithm.
Abstract（参考訳）: 本稿では,MNL(Multinomial Logit)選択モデルに従う顧客の選択行動と,アトラクションパラメータが不明確であることを前提として,オンライン共同配置-発明最適化問題について検討する。小売業者は、予想総利益を時間とともに最大化しつつ、アトラクションパラメータに関する現実的な要求から動的に学習する周期的なアソシエーションと在庫決定を行う。本稿では,ソートとインベントリのオンライン意思決定における探索と活用を効果的にバランスさせる新しいアルゴリズムを提案する。提案アルゴリズムは,MNLアトラクションパラメータの新しい推定器,未知のパラメータを適応的に調整することで探索をインセンティブ化する新しい手法,および与えられたパラメータを用いた静的単一サイクルアソート・イニシアティブ計画問題への最適化オラクルに基づく。我々は,我々のアルゴリズムに対する後悔の上限と,オンライン・ジョイント・ソートメント・発明最適化問題の下限を定め,静的最適化のオラクルが正確であることから,我々のアルゴリズムがほぼ最適の後悔率を達成したことを示唆する。そこで我々は,より実用的な近似的静的最適化オラクルをアルゴリズムに組み込んで,アルゴリズムの後悔に対する静的最適化誤差の影響を克服する。最後に,提案アルゴリズムの有効性を実証するために数値解析を行った。

関連論文リスト

Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文参考訳（メタデータ） (2025-05-13T16:47:00Z)
An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。 2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文参考訳（メタデータ） (2024-09-04T14:36:20Z)
Discovering Preference Optimization Algorithms with and for Large Language Models [50.843710797024805]
オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文参考訳（メタデータ） (2024-06-12T16:58:41Z)
Stop Relying on No-Choice and Do not Repeat the Moves: Optimal, Efficient and Practical Algorithms for Assortment Optimization [38.57171985309975]
本研究では,emphPlackett Luce (PL) を用いたコンソーシアム選択問題に対する効率的なアルゴリズムを開発した。提案手法は,既存の手法の限界を無視し,実用的かつ確実に最適である。
論文参考訳（メタデータ） (2024-02-29T07:17:04Z)
Parameter-Free Algorithms for Performative Regret Minimization under Decision-Dependent Distributions [15.396561118589577]
パフォーマンスリスク最小化は、決定依存分布の下での最適化の定式化である。我々のアルゴリズムは、既存のリプシッツ定数分布パラメータに基づく手法を大幅に改善する。提案手法は,既存手法と他のブラックボックス楽観的最適化手法に比較して,アルゴリズムの数値的優位性を示す実験結果を提供する。
論文参考訳（メタデータ） (2024-02-23T08:36:28Z)
End-to-End Learning for Fair Multiobjective Optimization Under Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文参考訳（メタデータ） (2024-02-12T16:33:35Z)
Predict-Then-Optimize by Proxy: Learning Joint Models of Prediction and Optimization [59.386153202037086]
Predict-Then-フレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。このアプローチは非効率であり、最適化ステップを通じてバックプロパゲーションのための手作りの、問題固有のルールを必要とする。本稿では,予測モデルを用いて観測可能な特徴から最適解を直接学習する手法を提案する。
論文参考訳（メタデータ） (2023-11-22T01:32:06Z)
Efficient Learning of Decision-Making Models: A Penalty Block Coordinate Descent Algorithm for Data-Driven Inverse Optimization [12.610576072466895]
我々は、意思決定プロセスを明らかにするために、事前の意思決定データを使用する逆問題を考える。この統計的学習問題は、データ駆動逆最適化と呼ばれる。そこで本稿では,大規模問題を解くために,効率的なブロック座標降下に基づくアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-10-27T12:52:56Z)
Generalizing Bayesian Optimization with Decision-theoretic Entropies [102.82152945324381]
統計的決定論の研究からシャノンエントロピーの一般化を考える。まず,このエントロピーの特殊なケースがBO手順でよく用いられる獲得関数に繋がることを示す。次に、損失に対する選択肢の選択が、どのようにして柔軟な獲得関数の族をもたらすかを示す。
論文参考訳（メタデータ） (2022-10-04T04:43:58Z)
Optimal Parameter-free Online Learning with Switching Cost [47.415099037249085]
オンライン学習における自由とは、後ろ向きの最適決定に対するアルゴリズムの適応性を指す。本稿では,パラメータフリーで要求される楽観的な更新を,スイッチングコストを前提として,そのようなアルゴリズムを設計する。本稿では,オンライン線形最適化 (OLO) のための簡易かつ強力なアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-05-13T18:44:27Z)
Convergence of adaptive algorithms for weakly convex constrained optimization [59.36386973876765]
モローエンベロープの勾配のノルムに対して$mathcaltilde O(t-1/4)$収束率を証明する。我々の分析では、最小バッチサイズが1ドル、定数が1位と2位のモーメントパラメータが1ドル、そしておそらくスムーズな最適化ドメインで機能する。
論文参考訳（メタデータ） (2020-06-11T17:43:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。