論文の概要: Online Learning and Optimization for Revenue Management Problems with
Add-on Discounts
- arxiv url: http://arxiv.org/abs/2005.00947v1
- Date: Sat, 2 May 2020 23:54:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 13:09:35.744993
- Title: Online Learning and Optimization for Revenue Management Problems with
Add-on Discounts
- Title(参考訳): アドオン割引による収益管理問題のオンライン学習と最適化
- Authors: David Simchi-Levi, Rui Sun, Huanan Zhang
- Abstract要約: 我々は、この問題を最適化問題として定式化し、異なる商品の価格とアドオン割引商品の選択を決定する。
所望の精度にほぼ近い精度で問題を解くことができる効率的なFPTASアルゴリズムを提案する。
我々の学習アルゴリズムは、真の需要関数にアクセスできる最適なアルゴリズムに収束できることを示す。
- 参考スコア(独自算出の注目度): 14.844382070740524
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study in this paper a revenue management problem with add-on discounts.
The problem is motivated by the practice in the video game industry, where a
retailer offers discounts on selected supportive products (e.g. video games) to
customers who have also purchased the core products (e.g. video game consoles).
We formulate this problem as an optimization problem to determine the prices of
different products and the selection of products with add-on discounts. To
overcome the computational challenge of this optimization problem, we propose
an efficient FPTAS algorithm that can solve the problem approximately to any
desired accuracy. Moreover, we consider the revenue management problem in the
setting where the retailer has no prior knowledge of the demand functions of
different products. To resolve this problem, we propose a UCB-based learning
algorithm that uses the FPTAS optimization algorithm as a subroutine. We show
that our learning algorithm can converge to the optimal algorithm that has
access to the true demand functions, and we prove that the convergence rate is
tight up to a certain logarithmic term. In addition, we conduct numerical
experiments with the real-world transaction data we collect from a popular
video gaming brand's online store on Tmall.com. The experiment results
illustrate our learning algorithm's robust performance and fast convergence in
various scenarios. We also compare our algorithm with the optimal policy that
does not use any add-on discount, and the results show the advantages of using
the add-on discount strategy in practice.
- Abstract(参考訳): 本稿では,アドオン割引による収益管理問題について考察する。
この問題は、ビデオゲーム業界において、小売業者が選択した支援製品(ビデオゲームなど)を、コア製品(ビデオゲームコンソールなど)を購入した顧客に割引するプラクティスに動機づけられている。
この問題を最適化問題として定式化し,様々な製品の価格とアドオン割引による製品の選択を決定する。
この最適化問題の計算課題を克服するために,任意の精度で解くことができる効率的なFPTASアルゴリズムを提案する。
また、小売業者が異なる商品の需要機能について事前知識を持っていない状況において、収益管理の問題を考える。
この問題を解決するために,FPTAS最適化アルゴリズムをサブルーチンとして用いた UCB ベースの学習アルゴリズムを提案する。
学習アルゴリズムは,真の需要関数にアクセス可能な最適アルゴリズムに収束できることを示し,その収束率が特定の対数項に密着していることを証明する。
また、Tmall.com上の人気ゲームブランドのオンラインストアから収集した実世界の取引データを用いて数値実験を行った。
実験結果は,学習アルゴリズムのロバストな性能と様々なシナリオでの高速収束を示す。
また,このアルゴリズムを,アドオン割引を一切使用しない最適ポリシーと比較した結果,実際にアドオン割引戦略を用いることの利点が示された。
関連論文リスト
- Contractual Reinforcement Learning: Pulling Arms with Invisible Hands [68.77645200579181]
本稿では,契約設計によるオンライン学習問題において,利害関係者の経済的利益を整合させる理論的枠組みを提案する。
計画問題に対して、遠目エージェントに対する最適契約を決定するための効率的な動的プログラミングアルゴリズムを設計する。
学習問題に対して,契約の堅牢な設計から探索と搾取のバランスに至るまでの課題を解き放つために,非回帰学習アルゴリズムの汎用設計を導入する。
論文 参考訳(メタデータ) (2024-07-01T16:53:00Z) - Learning with Posterior Sampling for Revenue Management under Time-varying Demand [36.22276574805786]
価格設定項目やサービスによる収益を最大化するための収益管理問題について議論する。
この問題の1つの課題は、需要分布が未知であり、航空会社や小売業のような実際の応用において時間とともに変化することである。
論文 参考訳(メタデータ) (2024-05-08T09:28:26Z) - Online Conversion with Switching Costs: Robust and Learning-Augmented Algorithms [11.029788598491077]
エネルギーとサステナビリティの交差点で発生した問題を捉えるオンライン問題の一群である,スイッチングコストによるオンライン変換について検討する。
本稿では,この問題の決定論的および決定論的変異に対して,競合的(ロバストな)しきい値に基づくアルゴリズムを導入する。
そこで我々は,ブラックボックスのアドバイスを活かした学習強化アルゴリズムを提案し,平均ケース性能を著しく向上させた。
論文 参考訳(メタデータ) (2023-10-31T16:34:49Z) - Landscape Surrogate: Learning Decision Losses for Mathematical
Optimization Under Partial Information [48.784330281177446]
学習統合最適化の最近の研究は、最適化が部分的にのみ観察される場合や、専門家のチューニングなしに汎用性が不十分な環境では有望であることを示している。
本稿では,$fcirc mathbfg$の代替として,スムーズで学習可能なランドスケープサロゲートを提案する。
このサロゲートはニューラルネットワークによって学習可能で、$mathbfg$ソルバよりも高速に計算でき、トレーニング中に密度が高く滑らかな勾配を提供し、目に見えない最適化問題に一般化でき、交互最適化によって効率的に学習される。
論文 参考訳(メタデータ) (2023-07-18T04:29:16Z) - Buying Information for Stochastic Optimization [16.272461309965284]
最適化のための情報の購入方法と,オンライン学習問題としてこの問題を定式化する方法について検討する。
この比は、スキーレンタル問題の堅牢な一般化と同値であり、超マーチンゲール停止(super-martingale stop)と呼ぶことから、厳密であることを示す。
動作を選択し、根底にある要求に関する情報をいつ購入するかを判断する8ドルの競合アルゴリズムを時間内に実行します。
論文 参考訳(メタデータ) (2023-06-06T11:50:09Z) - Learning to Optimize Permutation Flow Shop Scheduling via Graph-based
Imitation Learning [70.65666982566655]
置換フローショップスケジューリング(PFSS)は製造業で広く使われている。
我々は,より安定かつ正確に収束を加速する専門家主導の模倣学習を通じてモデルを訓練することを提案する。
我々のモデルのネットワークパラメータはわずか37%に減少し、エキスパートソリューションに対する我々のモデルの解のギャップは平均6.8%から1.3%に減少する。
論文 参考訳(メタデータ) (2022-10-31T09:46:26Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - MNL-Bandits under Inventory and Limited Switches Constraints [38.960764902819434]
我々は、データから顧客の選択を学習しながら、アソートを最適化する効率的な UCB ライクなアルゴリズムを開発した。
我々のアルゴリズムは、$O(Talpha)$スイッチが許される場合、サブ線形後悔境界$tildeOleft(T1-alpha/2right)$を達成できることを証明している。
論文 参考訳(メタデータ) (2022-04-22T16:02:27Z) - Efficient and Optimal Algorithms for Contextual Dueling Bandits under
Realizability [59.81339109121384]
我々は,学習者が文脈情報を用いて2つの決定を下す連続的な決定設定であるK$コンテキストデュエルバンディット問題について検討するが,一方の判断が他方よりも優れていることを示唆する強調基準に基づくフィードバックのみを観察する。
提案手法は, 最善応答後悔という新たな概念に対して, 最善応答後悔に対する最適後悔率を実現するアルゴリズムである。
論文 参考訳(メタデータ) (2021-11-24T07:14:57Z) - Online Apprenticeship Learning [58.45089581278177]
見習い学習(AL)では、コスト関数にアクセスせずにマルコフ決定プロセス(MDP)が与えられます。
目標は、事前に定義されたコスト関数のセットで専門家のパフォーマンスに一致するポリシーを見つけることです。
ミラー下降型ノンレグレットアルゴリズムを2つ組み合わせることで,OAL問題を効果的に解くことができることを示す。
論文 参考訳(メタデータ) (2021-02-13T12:57:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。