論文の概要: On Dynamic Pricing with Covariates
- arxiv url: http://arxiv.org/abs/2112.13254v3
- Date: Mon, 13 Nov 2023 13:55:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-15 00:53:43.279916
- Title: On Dynamic Pricing with Covariates
- Title(参考訳): 共変量による動的価格設定について
- Authors: Hanzhao Wang, Kalyan Talluri, Xiaocheng Li
- Abstract要約: UCBとThompsonのサンプリングに基づく価格設定アルゴリズムは、$O(dsqrtTlog T)$ regret upper boundを実現できることを示す。
私たちの後悔に対する上限は、対数的要因までの下位境界と一致します。
- 参考スコア(独自算出の注目度): 6.6543199581017625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider dynamic pricing with covariates under a generalized linear demand
model: a seller can dynamically adjust the price of a product over a horizon of
$T$ time periods, and at each time period $t$, the demand of the product is
jointly determined by the price and an observable covariate vector
$x_t\in\mathbb{R}^d$ through a generalized linear model with unknown
co-efficients. Most of the existing literature assumes the covariate vectors
$x_t$'s are independently and identically distributed (i.i.d.); the few papers
that relax this assumption either sacrifice model generality or yield
sub-optimal regret bounds. In this paper, we show that UCB and Thompson
sampling-based pricing algorithms can achieve an $O(d\sqrt{T}\log T)$ regret
upper bound without assuming any statistical structure on the covariates $x_t$.
Our upper bound on the regret matches the lower bound up to logarithmic
factors. We thus show that (i) the i.i.d. assumption is not necessary for
obtaining low regret, and (ii) the regret bound can be independent of the
(inverse) minimum eigenvalue of the covariance matrix of the $x_t$'s, a
quantity present in previous bounds. Moreover, we consider a constrained
setting of the dynamic pricing problem where there is a limited and
unreplenishable inventory and we develop theoretical results that relate the
best achievable algorithm performance to a variation measure with respect to
the temporal distribution shift of the covariates. We also discuss conditions
under which a better regret is achievable and demonstrate the proposed
algorithms' performance with numerical experiments.
- Abstract(参考訳): 販売者は、商品の価格を時間的水平線上で動的に調整することができ、各期間$t$は、その価格と観測可能な共変数ベクトル$x_t\in\mathbb{R}^d$によって、未知の共係数の一般線形モデルにより、製品の需要を共同で決定する。
既存の文献の多くは、共変ベクトル $x_t$'s は独立かつ同一に分布していると仮定している(つまり、この仮定を緩和する数少ない論文は、モデル一般性を犠牲にするか、準最適後悔境界を与えるかのいずれかである)。
本稿では, UCBとトンプソンのサンプリングに基づく価格決定アルゴリズムが, 共変量$x_t$の統計構造を仮定することなく, $O(d\sqrt{T}\log T)$ regret upper boundを実現できることを示す。
私たちの後悔に対する上限は、対数的要因までの下位境界と一致します。
したがって私たちは
(i)低い後悔を得るためには、i.d.仮定は不要であり、
(ii) 後悔境界は、前の境界に存在する$x_t$'sの共分散行列の(逆)最小固有値とは独立である。
さらに,限定的かつ補充不能な在庫が存在する動的価格問題の制約された設定を考察し,共変量の時間分布シフトに関して,最良の達成可能なアルゴリズム性能を変動尺度に関連付ける理論的結果を開発した。
また,良好な後悔が達成できる条件について検討し,数値実験により提案アルゴリズムの性能を実証する。
関連論文リスト
- Convergence Rate Analysis of LION [54.28350823319057]
LION は、勾配カルシュ=クーン=T (sqrtdK-)$で測定された $cal(sqrtdK-)$ の反復を収束する。
従来のSGDと比較して,LIONは損失が小さく,性能も高いことを示す。
論文 参考訳(メタデータ) (2024-11-12T11:30:53Z) - Minimax Optimality in Contextual Dynamic Pricing with General Valuation Models [4.156757591117864]
本稿では,問題に対する仮定を最小化しながら,改善された後悔境界を実現する新しいアルゴリズムを提案する。
本手法は, 一般関数空間を考慮し, 動的価格設定によく用いられる線形評価モデルを超えて拡張する。
論文 参考訳(メタデータ) (2024-06-24T23:43:56Z) - Contextual Dynamic Pricing: Algorithms, Optimality, and Local Differential Privacy Constraints [10.057344315478709]
企業が商品をT$で販売する状況的動的価格問題について検討する。
まず、最適後悔上限は、対数係数まで、次数$sqrtdT$であることを示す。
理論的結果の重要な洞察は、動的価格と文脈的マルチアームバンディット問題との本質的な関係である。
論文 参考訳(メタデータ) (2024-06-04T15:44:10Z) - Efficient Frameworks for Generalized Low-Rank Matrix Bandit Problems [61.85150061213987]
一般化線形モデル (GLM) フレームワークを用いて, citelu2021low で提案した一般化低ランク行列帯域問題について検討する。
既存のアルゴリズムの計算不可能性と理論的制約を克服するため,まずG-ESTTフレームワークを提案する。
G-ESTT は $tildeO(sqrt(d_1+d_2)3/2Mr3/2T)$ bound of regret を達成でき、G-ESTS は $tildeO を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-14T14:14:19Z) - Adversarial Contextual Bandits Go Kernelized [21.007410990554522]
本研究では、ヒルベルト核空間に属する損失関数を組み込むことにより、逆線形文脈帯域におけるオンライン学習の問題を一般化する。
本稿では,損失関数を推定し,ほぼ最適の後悔の保証を再現するための新しい楽観的偏り推定器を提案する。
論文 参考訳(メタデータ) (2023-10-02T19:59:39Z) - Variance-Aware Regret Bounds for Stochastic Contextual Dueling Bandits [53.281230333364505]
本稿では, 一般化線形モデル(GLM)から, デュエルアームのバイナリ比較を生成するコンテキストデュエルバンド問題について検討する。
本稿では,SupLinUCB型アルゴリズムを提案する。このアルゴリズムは,計算効率と分散を意識したリセットバウンド$tilde Obig(dsqrtsum_t=1Tsigma_t2 + dbig)$を提案する。
我々の後悔は、比較が決定論的である場合の直感的な期待と自然に一致し、アルゴリズムは$tilde O(d)$ regretにのみ悩まされる。
論文 参考訳(メタデータ) (2023-10-02T08:15:52Z) - Contextual Combinatorial Bandits with Probabilistically Triggered Arms [55.9237004478033]
確率的に誘発される腕(C$2$MAB-T)を様々な滑らかさ条件下で検討した。
トリガー変調 (TPM) 条件の下では、C$2$-UC-Tアルゴリズムを考案し、後悔すべき$tildeO(dsqrtT)$を導出する。
論文 参考訳(メタデータ) (2023-03-30T02:51:00Z) - Variance-Dependent Regret Bounds for Linear Bandits and Reinforcement
Learning: Adaptivity and Computational Efficiency [90.40062452292091]
本稿では,不整合雑音を持つ線形帯域に対する計算効率のよい最初のアルゴリズムを提案する。
我々のアルゴリズムは未知のノイズの分散に適応し、$tildeO(d sqrtsum_k = 1K sigma_k2 + d)$ regretを達成する。
また、強化学習において、線形混合マルコフ決定過程(MDP)に対する分散適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-21T00:17:24Z) - Dynamic Pricing and Learning under the Bass Model [16.823029377470366]
マーケットサイズが$m$である場合、オーダー$tilde O(m2/3)$の確率後悔保証を満足するアルゴリズムを開発する。
多くの後悔の分析結果とは異なり、現在の問題では市場規模$m$が複雑さの基本的な要因である。
論文 参考訳(メタデータ) (2021-03-09T03:27:33Z) - Adaptive Online Estimation of Piecewise Polynomial Trends [23.91519151164528]
我々は,2乗誤差損失と雑音勾配フィードバックを伴う非定常最適化の枠組みを考察する。
非パラメトリック回帰理論から動機づけられた新しい変分制約を導入する。
我々は、同じ方針が、他のいくつかの非パラメトリックな関心の族に最適であることを示す。
論文 参考訳(メタデータ) (2020-09-30T19:30:28Z) - Dynamic Regret of Convex and Smooth Functions [93.71361250701075]
非定常環境におけるオンライン凸最適化について検討する。
パフォーマンス指標として動的後悔を選択します。
本研究では, 滑らかさを活かして, 動的後悔をさらに高めることが可能であることを示す。
論文 参考訳(メタデータ) (2020-07-07T14:10:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。