論文の概要: Dynamic Pricing and Learning under the Bass Model
- arxiv url: http://arxiv.org/abs/2103.05199v1
- Date: Tue, 9 Mar 2021 03:27:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-11 13:12:05.114675
- Title: Dynamic Pricing and Learning under the Bass Model
- Title(参考訳): Bassモデルに基づく動的価格設定と学習
- Authors: Shipra Agrawal, Steven Yin, Assaf Zeevi
- Abstract要約: マーケットサイズが$m$である場合、オーダー$tilde O(m2/3)$の確率後悔保証を満足するアルゴリズムを開発する。
多くの後悔の分析結果とは異なり、現在の問題では市場規模$m$が複雑さの基本的な要因である。
- 参考スコア(独自算出の注目度): 16.823029377470366
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider a novel formulation of the dynamic pricing and demand learning
problem, where the evolution of demand in response to posted prices is governed
by a stochastic variant of the popular Bass model with parameters $\alpha,
\beta$ that are linked to the so-called "innovation" and "imitation" effects.
Unlike the more commonly used i.i.d. and contextual demand models, in this
model the posted price not only affects the demand and the revenue in the
current round but also the future evolution of demand, and hence the fraction
of potential market size $m$ that can be ultimately captured. In this paper, we
consider the more challenging incomplete information problem where dynamic
pricing is applied in conjunction with learning the unknown parameters, with
the objective of optimizing the cumulative revenues over a given selling
horizon of length $T$. Equivalently, the goal is to minimize the regret which
measures the revenue loss of the algorithm relative to the optimal expected
revenue achievable under the stochastic Bass model with market size $m$ and
time horizon $T$. Our main contribution is the development of an algorithm that
satisfies a high probability regret guarantee of order $\tilde O(m^{2/3})$;
where the market size $m$ is known a priori. Moreover, we show that no
algorithm can incur smaller order of loss by deriving a matching lower bound.
Unlike most regret analysis results, in the present problem the market size $m$
is the fundamental driver of the complexity; our lower bound in fact, indicates
that for any fixed $\alpha, \beta$, most non-trivial instances of the problem
have constant $T$ and large $m$. We believe that this insight sets the problem
of dynamic pricing under the Bass model apart from the typical i.i.d. setting
and multi-armed bandit based models for dynamic pricing, which typically focus
only on the asymptotics with respect to time horizon $T$.
- Abstract(参考訳): 本稿では, 価格変動に伴う需要の変動をパラメータ$\alpha, \beta$という, いわゆる「革新」効果と「模倣」効果に関連付けた, 一般的なバスモデルの確率的変種によって制御する, 動的価格・需要学習問題の新たな定式化について考察する。
一般的に使われる i. i. d. とは異なり
そして文脈的な需要モデル、このモデルでは、掲載価格は現在のラウンドにおける需要と収益に影響を与えるだけでなく、需要の将来の進化にも影響します。
本稿では,未知のパラメータの学習とともに動的価格を適用するという,より困難な不完全情報問題について考察する。
これと同等の目標は、市場規模$m$とtime horizon $t$を持つ確率的ベースモデルで実現可能な最適な期待収益に対するアルゴリズムの収益損失を最小化することである。
私達の主な貢献は順序$\tilde O(m^{2/3})$の高い確率の後悔の保証を満たすアルゴリズムの開発です。
さらに, 一致する下限を導出することにより, 損失順序が小さくなるアルゴリズムは存在しないことを示す。
ほとんどの後悔分析の結果とは異なり、現在の問題では、市場規模$m$が複雑さの根本的な原動力である。私たちの低い境界は、任意の固定 $\alpha, \beta$ に対して、問題のほとんどの非自明なインスタンスは一定の $T$ と大きな $m$ を持つことを示しています。
この洞察は、典型的なi.i.d.とは別として、ベースモデルの下での動的価格設定の問題を引き起こすと信じている。
動的価格の設定とマルチアームのバンディットベースのモデルは、典型的にはタイムホライズン$t$の漸近性のみに焦点を当てている。
関連論文リスト
- Convergence Rate Analysis of LION [54.28350823319057]
LION は、勾配カルシュ=クーン=T (sqrtdK-)$で測定された $cal(sqrtdK-)$ の反復を収束する。
従来のSGDと比較して,LIONは損失が小さく,性能も高いことを示す。
論文 参考訳(メタデータ) (2024-11-12T11:30:53Z) - Minimax Optimality in Contextual Dynamic Pricing with General Valuation Models [4.156757591117864]
本稿では,問題に対する仮定を最小化しながら,改善された後悔境界を実現する新しいアルゴリズムを提案する。
本手法は, 一般関数空間を考慮し, 動的価格設定によく用いられる線形評価モデルを超えて拡張する。
論文 参考訳(メタデータ) (2024-06-24T23:43:56Z) - Contextual Dynamic Pricing: Algorithms, Optimality, and Local Differential Privacy Constraints [10.057344315478709]
企業が商品をT$で販売する状況的動的価格問題について検討する。
まず、最適後悔上限は、対数係数まで、次数$sqrtdT$であることを示す。
理論的結果の重要な洞察は、動的価格と文脈的マルチアームバンディット問題との本質的な関係である。
論文 参考訳(メタデータ) (2024-06-04T15:44:10Z) - Dynamic Pricing and Learning with Long-term Reference Effects [16.07344044662994]
本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。
このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。
次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文 参考訳(メタデータ) (2024-02-19T21:36:54Z) - Smoothness-Adaptive Dynamic Pricing with Nonparametric Demand Learning [0.0]
需要関数が非パラメトリックでH"古い"スムーズな動的価格問題について検討する。
我々は、要求関数の未知のH"古い滑らか度パラメータ$beta$への適応性に焦点を当てる。
論文 参考訳(メタデータ) (2023-10-11T15:02:13Z) - Settling the Sample Complexity of Online Reinforcement Learning [92.02082223856479]
バーンインコストを発生させることなく、最小限の最適後悔を実現する方法を示す。
最適値/コストや一定の分散といった問題依存量の影響を明らかにするために、我々の理論を拡張します。
論文 参考訳(メタデータ) (2023-07-25T15:42:11Z) - Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。
報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。
次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文 参考訳(メタデータ) (2022-12-12T21:37:36Z) - Quantum computational finance: martingale asset pricing for incomplete
markets [69.73491758935712]
金融の価格問題に様々な量子技術を適用することができることを示す。
従来の研究と異なる3つの方法について議論する。
論文 参考訳(メタデータ) (2022-09-19T09:22:01Z) - Causal Bandits for Linear Structural Equation Models [58.2875460517691]
本稿では,因果図形モデルにおける最適な介入順序を設計する問題について検討する。
グラフの構造は知られており、ノードは$N$である。
頻繁性(UCBベース)とベイズ的設定に2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-26T16:21:31Z) - Policy Optimization Using Semiparametric Models for Dynamic Pricing [1.3428344011390776]
商品の市場価値が観測された特徴と市場ノイズに線形である状況的動的価格問題について検討する。
一般化線形モデルからの半パラメトリック推定と未知のリンクとオンライン意思決定を組み合わせた動的統計的学習と意思決定ポリシーを提案する。
論文 参考訳(メタデータ) (2021-09-13T23:50:01Z) - Exploring Sparse Expert Models and Beyond [51.90860155810848]
Mixture-of-Experts (MoE) モデルは、無数のパラメータを持つが、一定の計算コストで有望な結果が得られる。
本稿では,専門家を異なるプロトタイプに分割し,上位1ドルのルーティングに$k$を適用する,エキスパートプロトタイピングというシンプルな手法を提案する。
この戦略は, モデル品質を向上させるが, 一定の計算コストを維持するとともに, 大規模モデルのさらなる探索により, 大規模モデルの訓練に有効であることが示唆された。
論文 参考訳(メタデータ) (2021-05-31T16:12:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。