論文の概要: On Dynamic Pricing with Covariates
- arxiv url: http://arxiv.org/abs/2112.13254v1
- Date: Sat, 25 Dec 2021 16:30:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-28 14:38:58.892829
- Title: On Dynamic Pricing with Covariates
- Title(参考訳): 共変量による動的価格設定について
- Authors: Hanzhao Wang, Kalyan Talluri, Xiaocheng Li
- Abstract要約: 単純な価格アルゴリズムは、統計的構造を仮定することなく、$O(dsqrtTlog T)$ regret upper boundを持つことを示す。
後悔の上限の上限は、下限(すなわち仮定の下でも)から対数的因子に一致する。
- 参考スコア(独自算出の注目度): 2.7415307133655413
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the dynamic pricing problem with covariates under a generalized
linear demand model: a seller can dynamically adjust the price of a product
over a horizon of $T$ time periods, and at each time period $t$, the demand of
the product is jointly determined by the price and an observable covariate
vector $x_t\in\mathbb{R}^d$ through an unknown generalized linear model. Most
of the existing literature assumes the covariate vectors $x_t$'s are
independently and identically distributed (i.i.d.); the few papers that relax
this assumption either sacrifice model generality or yield sub-optimal regret
bounds. In this paper we show that a simple pricing algorithm has an
$O(d\sqrt{T}\log T)$ regret upper bound without assuming any statistical
structure on the covariates $x_t$ (which can even be arbitrarily chosen). The
upper bound on the regret matches the lower bound (even under the i.i.d.
assumption) up to logarithmic factors. Our paper thus shows that (i) the i.i.d.
assumption is not necessary for obtaining low regret, and (ii) the regret bound
can be independent of the (inverse) minimum eigenvalue of the covariance matrix
of the $x_t$'s, a quantity present in previous bounds. Furthermore, we discuss
a condition under which a better regret is achievable and how a Thompson
sampling algorithm can be applied to give an efficient computation of the
prices.
- Abstract(参考訳): 一般線形需要モデルの下で共変量を用いた動的価格問題を考える: 売り手は商品の価格を時間的水平線上で動的に調整することができ、各時点の$t$は、その価格と観測可能な共変量ベクトル$x_t\in\mathbb{R}^d$によって、未知の一般化線形モデルにより、製品の需要を共同で決定する。
既存の文献の多くは、共変ベクトル $x_t$'s は独立かつ同一に分布していると仮定している(つまり、この仮定を緩和する数少ない論文は、モデル一般性を犠牲にするか、準最適後悔境界を与えるかのいずれかである)。
本稿では,covariates $x_t$(任意に選択することもできる)の統計構造を仮定することなく,簡単な価格設定アルゴリズムが$o(d\sqrt{t}\log t)$ regret upperboundを持つことを示す。
後悔の上限は(i.i.d.仮定の下でも)対数的要因による下限に一致する。
私たちの論文は
(i)低い後悔を得るためには、i.d.仮定は不要であり、
(ii) 後悔境界は、前の境界に存在する$x_t$'sの共分散行列の(逆)最小固有値とは独立である。
さらに,よりよい後悔が達成できる条件と,トンプソンサンプリングアルゴリズムを適用して,効率的な価格計算を行う方法について検討する。
関連論文リスト
- Convergence Rate Analysis of LION [54.28350823319057]
LION は、勾配カルシュ=クーン=T (sqrtdK-)$で測定された $cal(sqrtdK-)$ の反復を収束する。
従来のSGDと比較して,LIONは損失が小さく,性能も高いことを示す。
論文 参考訳(メタデータ) (2024-11-12T11:30:53Z) - Minimax Optimality in Contextual Dynamic Pricing with General Valuation Models [4.156757591117864]
本稿では,問題に対する仮定を最小化しながら,改善された後悔境界を実現する新しいアルゴリズムを提案する。
本手法は, 一般関数空間を考慮し, 動的価格設定によく用いられる線形評価モデルを超えて拡張する。
論文 参考訳(メタデータ) (2024-06-24T23:43:56Z) - Contextual Dynamic Pricing: Algorithms, Optimality, and Local Differential Privacy Constraints [10.057344315478709]
企業が商品をT$で販売する状況的動的価格問題について検討する。
まず、最適後悔上限は、対数係数まで、次数$sqrtdT$であることを示す。
理論的結果の重要な洞察は、動的価格と文脈的マルチアームバンディット問題との本質的な関係である。
論文 参考訳(メタデータ) (2024-06-04T15:44:10Z) - Efficient Frameworks for Generalized Low-Rank Matrix Bandit Problems [61.85150061213987]
一般化線形モデル (GLM) フレームワークを用いて, citelu2021low で提案した一般化低ランク行列帯域問題について検討する。
既存のアルゴリズムの計算不可能性と理論的制約を克服するため,まずG-ESTTフレームワークを提案する。
G-ESTT は $tildeO(sqrt(d_1+d_2)3/2Mr3/2T)$ bound of regret を達成でき、G-ESTS は $tildeO を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-14T14:14:19Z) - Adversarial Contextual Bandits Go Kernelized [21.007410990554522]
本研究では、ヒルベルト核空間に属する損失関数を組み込むことにより、逆線形文脈帯域におけるオンライン学習の問題を一般化する。
本稿では,損失関数を推定し,ほぼ最適の後悔の保証を再現するための新しい楽観的偏り推定器を提案する。
論文 参考訳(メタデータ) (2023-10-02T19:59:39Z) - Variance-Aware Regret Bounds for Stochastic Contextual Dueling Bandits [53.281230333364505]
本稿では, 一般化線形モデル(GLM)から, デュエルアームのバイナリ比較を生成するコンテキストデュエルバンド問題について検討する。
本稿では,SupLinUCB型アルゴリズムを提案する。このアルゴリズムは,計算効率と分散を意識したリセットバウンド$tilde Obig(dsqrtsum_t=1Tsigma_t2 + dbig)$を提案する。
我々の後悔は、比較が決定論的である場合の直感的な期待と自然に一致し、アルゴリズムは$tilde O(d)$ regretにのみ悩まされる。
論文 参考訳(メタデータ) (2023-10-02T08:15:52Z) - Contextual Combinatorial Bandits with Probabilistically Triggered Arms [55.9237004478033]
確率的に誘発される腕(C$2$MAB-T)を様々な滑らかさ条件下で検討した。
トリガー変調 (TPM) 条件の下では、C$2$-UC-Tアルゴリズムを考案し、後悔すべき$tildeO(dsqrtT)$を導出する。
論文 参考訳(メタデータ) (2023-03-30T02:51:00Z) - Variance-Dependent Regret Bounds for Linear Bandits and Reinforcement
Learning: Adaptivity and Computational Efficiency [90.40062452292091]
本稿では,不整合雑音を持つ線形帯域に対する計算効率のよい最初のアルゴリズムを提案する。
我々のアルゴリズムは未知のノイズの分散に適応し、$tildeO(d sqrtsum_k = 1K sigma_k2 + d)$ regretを達成する。
また、強化学習において、線形混合マルコフ決定過程(MDP)に対する分散適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-21T00:17:24Z) - Dynamic Pricing and Learning under the Bass Model [16.823029377470366]
マーケットサイズが$m$である場合、オーダー$tilde O(m2/3)$の確率後悔保証を満足するアルゴリズムを開発する。
多くの後悔の分析結果とは異なり、現在の問題では市場規模$m$が複雑さの基本的な要因である。
論文 参考訳(メタデータ) (2021-03-09T03:27:33Z) - Adaptive Online Estimation of Piecewise Polynomial Trends [23.91519151164528]
我々は,2乗誤差損失と雑音勾配フィードバックを伴う非定常最適化の枠組みを考察する。
非パラメトリック回帰理論から動機づけられた新しい変分制約を導入する。
我々は、同じ方針が、他のいくつかの非パラメトリックな関心の族に最適であることを示す。
論文 参考訳(メタデータ) (2020-09-30T19:30:28Z) - Dynamic Regret of Convex and Smooth Functions [93.71361250701075]
非定常環境におけるオンライン凸最適化について検討する。
パフォーマンス指標として動的後悔を選択します。
本研究では, 滑らかさを活かして, 動的後悔をさらに高めることが可能であることを示す。
論文 参考訳(メタデータ) (2020-07-07T14:10:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。