論文の概要: Contextual Dynamic Pricing with Heterogeneous Buyers
- arxiv url: http://arxiv.org/abs/2512.09513v1
- Date: Wed, 10 Dec 2025 10:36:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.486274
- Title: Contextual Dynamic Pricing with Heterogeneous Buyers
- Title(参考訳): 不均一買い手による文脈動的価格設定
- Authors: Thodoris Lykouris, Sloan Nietert, Princewill Okoroafor, Chara Podimata, Julian Zimmert,
- Abstract要約: 異種購入者によるコンテキスト動的価格設定について検討する。
我々は,前向きな後続サンプリングと後悔に基づく文脈的価格設定アルゴリズムを開発した。
我々は、分散対応ズームアルゴリズムの提案により、非コンテキスト価格の場合の分析を洗練する。
- 参考スコア(独自算出の注目度): 21.608390985958483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We initiate the study of contextual dynamic pricing with a heterogeneous population of buyers, where a seller repeatedly posts prices (over $T$ rounds) that depend on the observable $d$-dimensional context and receives binary purchase feedback. Unlike prior work assuming homogeneous buyer types, in our setting the buyer's valuation type is drawn from an unknown distribution with finite support size $K_{\star}$. We develop a contextual pricing algorithm based on optimistic posterior sampling with regret $\widetilde{O}(K_{\star}\sqrt{dT})$, which we prove to be tight in $d$ and $T$ up to logarithmic terms. Finally, we refine our analysis for the non-contextual pricing case, proposing a variance-aware zooming algorithm that achieves the optimal dependence on $K_{\star}$.
- Abstract(参考訳): そこでは、販売者が観測可能な$d$-dimensionalコンテキストに依存した価格(T$ラウンド以上)を繰り返し投稿し、バイナリ購入フィードバックを受け取る。
均一なバイヤータイプを仮定する以前の作業とは異なり、我々の設定では、バイヤーのバリュエーションタイプは、有限サポートサイズ$K_{\star}$の未知の分布から引き出される。
提案手法は,残響$\widetilde{O}(K_{\star}\sqrt{dT})$を用いて,楽観的な後続サンプリングに基づく文脈的価格決定アルゴリズムを開発し,対数項まで$d$および$T$で厳密であることが証明された。
最後に,K_{\star}$への最適依存を実現する分散対応ズームアルゴリズムを提案する。
関連論文リスト
- Dynamic Pricing with Adversarially-Censored Demands [25.566323930646178]
我々は,各時点における潜在需要が$t=1,2,ldots,T$であり,価格に依存するオンライン動的価格問題について検討する。
一度に$t$が課せられ、在庫水準を超えた場合の潜在的な需要を検閲する。
本アルゴリズムは,逆在庫級数であっても,$tildeO(sqrtT)$Optimative regretを達成できることを示す。
論文 参考訳(メタデータ) (2025-02-10T05:37:39Z) - Fast Rates for Bandit PAC Multiclass Classification [73.17969992976501]
我々は,帯域幅フィードバックを用いたマルチクラスPAC学習について検討し,入力を$K$ラベルの1つに分類し,予測されたラベルが正しいか否かに制限する。
我々の主な貢献は、問題の無知な$(varepsilon,delta)$PACバージョンのための新しい学習アルゴリズムを設計することである。
論文 参考訳(メタデータ) (2024-06-18T08:54:04Z) - Improved Algorithms for Contextual Dynamic Pricing [24.530341596901476]
コンテキスト動的価格設定では、売り手はコンテキスト情報に基づいて商品を順次価格設定する。
提案アルゴリズムは,$tildemathcalO(T2/3)$の最適再帰限界を達成し,既存の結果を改善する。
このモデルに対して,我々のアルゴリズムは,文脈空間の次元を$d$とする,後悔の$tildemathcalO(Td+2beta/d+3beta)$を得る。
論文 参考訳(メタデータ) (2024-06-17T08:26:51Z) - Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback [58.66941279460248]
人からのフィードバックから学ぶことは、大言語モデル(LLM)のような生成モデルを調整する上で重要な役割を果たす
本稿では,このドメイン内のモデルについて考察する。-文脈的デュエルバンディット(contextual dueling bandits)と,正の選好ラベルを相手によって反転させることができる対向フィードバック(reversarial feedback)について考察する。
本稿では,不確実性重み付き最大推定に基づく頑健なコンテキストデュエルバンドイット(RCDB)を提案する。
論文 参考訳(メタデータ) (2024-04-16T17:59:55Z) - Pricing with Contextual Elasticity and Heteroscedastic Valuation [23.96777734246062]
我々は、顧客がその特徴と価格に基づいて商品を購入するかどうかを決めるオンラインコンテキスト動的価格問題について検討する。
本稿では,機能に基づく価格弾力性の導入により,顧客の期待する需要をモデル化する新たなアプローチを提案する。
我々の結果は、文脈的弾力性とヘテロセダスティックな評価の関係に光を当て、効果的で実用的な価格戦略の洞察を与えました。
論文 参考訳(メタデータ) (2023-12-26T11:07:37Z) - Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。
報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。
次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文 参考訳(メタデータ) (2022-12-12T21:37:36Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - A new regret analysis for Adam-type algorithms [78.825194932103]
理論的には、オンライン凸最適化に対する後悔の保証は、急速に崩壊する$beta_1to0$スケジュールを必要とする。
最適なデータ依存リセット境界を一定の$beta_1$で導出できる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-21T19:19:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。