論文の概要: Dynamic Pricing and Learning with Bayesian Persuasion
- arxiv url: http://arxiv.org/abs/2304.14385v2
- Date: Sun, 10 Dec 2023 22:39:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-13 02:59:37.010245
- Title: Dynamic Pricing and Learning with Bayesian Persuasion
- Title(参考訳): ベイジアン説得による動的価格と学習
- Authors: Shipra Agrawal, Yiding Feng, Wei Tang
- Abstract要約: 我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境を考える。
我々は、バイエルンの一般的な説得フレームワークを使用して、これらのシグナルが購入者の評価と購入反応に与える影響をモデル化する。
我々は、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計する。
- 参考スコア(独自算出の注目度): 18.59029578133633
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We consider a novel dynamic pricing and learning setting where in addition to
setting prices of products in sequential rounds, the seller also ex-ante
commits to 'advertising schemes'. That is, in the beginning of each round the
seller can decide what kind of signal they will provide to the buyer about the
product's quality upon realization. Using the popular Bayesian persuasion
framework to model the effect of these signals on the buyers' valuation and
purchase responses, we formulate the problem of finding an optimal design of
the advertising scheme along with a pricing scheme that maximizes the seller's
expected revenue. Without any apriori knowledge of the buyers' demand function,
our goal is to design an online algorithm that can use past purchase responses
to adaptively learn the optimal pricing and advertising strategy. We study the
regret of the algorithm when compared to the optimal clairvoyant price and
advertising scheme.
Our main result is a computationally efficient online algorithm that achieves
an $O(T^{2/3}(m\log T)^{1/3})$ regret bound when the valuation function is
linear in the product quality. Here $m$ is the cardinality of the discrete
product quality domain and $T$ is the time horizon. This result requires some
natural monotonicity and Lipschitz assumptions on the valuation function, but
no Lipschitz or smoothness assumption on the buyers' demand function. For
constant $m$, our result matches the regret lower bound for dynamic pricing
within logarithmic factors, which is a special case of our problem. We also
obtain several improved results for the widely considered special case of
additive valuations, including an $\tilde{O}(T^{2/3})$ regret bound independent
of $m$ when $m\le T^{1/3}$.
- Abstract(参考訳): 我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境について考察する。
つまり、各ラウンドの開始時に、売り手は商品の品質について購入者にどのような信号を提供するかを決定することができる。
人気の高いベイズ説得フレームワークを用いて、これらのシグナルが購入者の評価と購入応答に及ぼす影響をモデル化し、販売者の期待収益を最大化する価格体系とともに、広告スキームの最適設計を求める問題を定式化する。
購入者の需要関数を事前に知ることなく、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計することを目標としている。
本稿では,最適な価格と広告手法と比較し,アルゴリズムの後悔について考察する。
我々の主な結果は計算効率の良いオンラインアルゴリズムであり、製品品質において評価関数が線形であるときに$o(t^{2/3}(m\log t)^{1/3})$ regret boundを達成する。
ここで $m$ は離散的製品品質ドメインの濃度であり、$t$ は時間軸である。
この結果は、バリュエーション関数に対する自然な単調性とリプシッツの仮定を必要とするが、購入者の要求関数に対するリプシッツや滑らかさの仮定は不要である。
定数$m$の場合、この結果は対数係数内での動的価格設定に対する後悔の少ない低い値と一致します。
また、より広範に考慮された加法評価の特別ケースに対して、$m$ の独立性を持つ $\tilde{O}(T^{2/3})$ regret bound を含むいくつかの改善された結果を得る。
関連論文リスト
- Procurement Auctions via Approximately Optimal Submodular Optimization [53.93943270902349]
競売業者がプライベートコストで戦略的売り手からサービスを取得しようとする競売について検討する。
我々の目標は、取得したサービスの品質と販売者の総コストとの差を最大化する計算効率の良いオークションを設計することである。
論文 参考訳(メタデータ) (2024-11-20T18:06:55Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Improved Algorithms for Contextual Dynamic Pricing [24.530341596901476]
コンテキスト動的価格設定では、売り手はコンテキスト情報に基づいて商品を順次価格設定する。
提案アルゴリズムは,$tildemathcalO(T2/3)$の最適再帰限界を達成し,既存の結果を改善する。
このモデルに対して,我々のアルゴリズムは,文脈空間の次元を$d$とする,後悔の$tildemathcalO(Td+2beta/d+3beta)$を得る。
論文 参考訳(メタデータ) (2024-06-17T08:26:51Z) - Dynamic Pricing and Learning with Long-term Reference Effects [16.07344044662994]
本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。
このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。
次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文 参考訳(メタデータ) (2024-02-19T21:36:54Z) - Pricing with Contextual Elasticity and Heteroscedastic Valuation [23.96777734246062]
我々は、顧客がその特徴と価格に基づいて商品を購入するかどうかを決めるオンラインコンテキスト動的価格問題について検討する。
本稿では,機能に基づく価格弾力性の導入により,顧客の期待する需要をモデル化する新たなアプローチを提案する。
我々の結果は、文脈的弾力性とヘテロセダスティックな評価の関係に光を当て、効果的で実用的な価格戦略の洞察を与えました。
論文 参考訳(メタデータ) (2023-12-26T11:07:37Z) - Contextual Dynamic Pricing with Strategic Buyers [93.97401997137564]
戦略的買い手によるコンテキスト動的価格問題について検討する。
売り手は買い手の真の特徴を観察せず、買い手の戦略行動に応じて操作された特徴を観察する。
本稿では,販売者の累積収益を最大化するために,購入者の戦略的行動をオンライン学習に取り入れた戦略的動的価格政策を提案する。
論文 参考訳(メタデータ) (2023-07-08T23:06:42Z) - Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。
報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。
次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文 参考訳(メタデータ) (2022-12-12T21:37:36Z) - Phase Transitions in Learning and Earning under Price Protection
Guarantee [4.683806391173103]
データ駆動型動的価格設定のためのオンライン学習アルゴリズムの設計にこのようなポリシーが与える影響について検討する。
最適な後悔は、まず基本的な不可能な体制を確立することで$tildeTheta(sqrtT+minM,,T2/3)$であることを示す。
我々は,下線プライス保護下でのアンダーライン学習とアンダーライン学習のための位相探索型アルゴリズムLEAPを提案する。
論文 参考訳(メタデータ) (2022-11-03T13:36:00Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Towards Agnostic Feature-based Dynamic Pricing: Linear Policies vs
Linear Valuation with Unknown Noise [16.871660060209674]
我々は,$tildeO(Tfrac34)$の後悔を実現するアルゴリズムを示し,$Omega(Tfrac35)$から$tildeOmega(Tfrac23)$への最もよく知られた下限を改善する。
その結果, 弱い仮定の下では, 特徴量に基づく動的価格設定が可能であることが示唆された。
論文 参考訳(メタデータ) (2022-01-27T06:40:03Z) - Online Learning with Imperfect Hints [72.4277628722419]
オンライン学習において,不完全な方向ヒントを用いたアルゴリズムを開発し,ほぼ一致している。
我々のアルゴリズムはヒントの品質を損なうものであり、後悔の限界は常に相関するヒントの場合と隠れない場合とを補間する。
論文 参考訳(メタデータ) (2020-02-11T23:06:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。