論文の概要: Dynamic Pricing and Learning with Bayesian Persuasion
- arxiv url: http://arxiv.org/abs/2304.14385v2
- Date: Sun, 10 Dec 2023 22:39:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-12-13 02:59:37.010245
- Title: Dynamic Pricing and Learning with Bayesian Persuasion
- Title(参考訳): ベイジアン説得による動的価格と学習
- Authors: Shipra Agrawal, Yiding Feng, Wei Tang
- Abstract要約: 我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境を考える。
我々は、バイエルンの一般的な説得フレームワークを使用して、これらのシグナルが購入者の評価と購入反応に与える影響をモデル化する。
我々は、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計する。
- 参考スコア(独自算出の注目度): 18.59029578133633
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We consider a novel dynamic pricing and learning setting where in addition to
setting prices of products in sequential rounds, the seller also ex-ante
commits to 'advertising schemes'. That is, in the beginning of each round the
seller can decide what kind of signal they will provide to the buyer about the
product's quality upon realization. Using the popular Bayesian persuasion
framework to model the effect of these signals on the buyers' valuation and
purchase responses, we formulate the problem of finding an optimal design of
the advertising scheme along with a pricing scheme that maximizes the seller's
expected revenue. Without any apriori knowledge of the buyers' demand function,
our goal is to design an online algorithm that can use past purchase responses
to adaptively learn the optimal pricing and advertising strategy. We study the
regret of the algorithm when compared to the optimal clairvoyant price and
advertising scheme.
Our main result is a computationally efficient online algorithm that achieves
an $O(T^{2/3}(m\log T)^{1/3})$ regret bound when the valuation function is
linear in the product quality. Here $m$ is the cardinality of the discrete
product quality domain and $T$ is the time horizon. This result requires some
natural monotonicity and Lipschitz assumptions on the valuation function, but
no Lipschitz or smoothness assumption on the buyers' demand function. For
constant $m$, our result matches the regret lower bound for dynamic pricing
within logarithmic factors, which is a special case of our problem. We also
obtain several improved results for the widely considered special case of
additive valuations, including an $\tilde{O}(T^{2/3})$ regret bound independent
of $m$ when $m\le T^{1/3}$.
- Abstract(参考訳): 我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境について考察する。
つまり、各ラウンドの開始時に、売り手は商品の品質について購入者にどのような信号を提供するかを決定することができる。
人気の高いベイズ説得フレームワークを用いて、これらのシグナルが購入者の評価と購入応答に及ぼす影響をモデル化し、販売者の期待収益を最大化する価格体系とともに、広告スキームの最適設計を求める問題を定式化する。
購入者の需要関数を事前に知ることなく、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計することを目標としている。
本稿では,最適な価格と広告手法と比較し,アルゴリズムの後悔について考察する。
我々の主な結果は計算効率の良いオンラインアルゴリズムであり、製品品質において評価関数が線形であるときに$o(t^{2/3}(m\log t)^{1/3})$ regret boundを達成する。
ここで $m$ は離散的製品品質ドメインの濃度であり、$t$ は時間軸である。
この結果は、バリュエーション関数に対する自然な単調性とリプシッツの仮定を必要とするが、購入者の要求関数に対するリプシッツや滑らかさの仮定は不要である。
定数$m$の場合、この結果は対数係数内での動的価格設定に対する後悔の少ない低い値と一致します。
また、より広範に考慮された加法評価の特別ケースに対して、$m$ の独立性を持つ $\tilde{O}(T^{2/3})$ regret bound を含むいくつかの改善された結果を得る。
関連論文リスト
- Procurement Auctions via Approximately Optimal Submodular Optimization [53.93943270902349]
競売業者がプライベートコストで戦略的売り手からサービスを取得しようとする競売について検討する。
我々の目標は、取得したサービスの品質と販売者の総コストとの差を最大化する計算効率の良いオークションを設計することである。
論文 参考訳(メタデータ) (2024-11-20T18:06:55Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Improved Algorithms for Contextual Dynamic Pricing [24.530341596901476]
コンテキスト動的価格設定では、売り手はコンテキスト情報に基づいて商品を順次価格設定する。
提案アルゴリズムは,$tildemathcalO(T2/3)$の最適再帰限界を達成し,既存の結果を改善する。
このモデルに対して,我々のアルゴリズムは,文脈空間の次元を$d$とする,後悔の$tildemathcalO(Td+2beta/d+3beta)$を得る。
論文 参考訳(メタデータ) (2024-06-17T08:26:51Z) - Dynamic Pricing and Learning with Long-term Reference Effects [16.07344044662994]
本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。
このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。
次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文 参考訳(メタデータ) (2024-02-19T21:36:54Z) - Pricing with Contextual Elasticity and Heteroscedastic Valuation [23.96777734246062]
我々は、顧客がその特徴と価格に基づいて商品を購入するかどうかを決めるオンラインコンテキスト動的価格問題について検討する。
本稿では,機能に基づく価格弾力性の導入により,顧客の期待する需要をモデル化する新たなアプローチを提案する。
我々の結果は、文脈的弾力性とヘテロセダスティックな評価の関係に光を当て、効果的で実用的な価格戦略の洞察を与えました。
論文 参考訳(メタデータ) (2023-12-26T11:07:37Z) - A Multimodal Analysis of Influencer Content on Twitter [40.41635575764701]
個人的な意見と商業的コンテンツの宣伝の線は、しばしばぼやけている。
これにより、インフルエンサー広告に関連する規制コンプライアンス違反の自動検出が困難になる。
我々は15,998のインフルエンサー投稿を商業的および非商業的カテゴリにマッピングした新しいTwitter(現在のX)データセットを紹介した。
論文 参考訳(メタデータ) (2023-09-06T15:07:23Z) - Contextual Dynamic Pricing with Strategic Buyers [93.97401997137564]
戦略的買い手によるコンテキスト動的価格問題について検討する。
売り手は買い手の真の特徴を観察せず、買い手の戦略行動に応じて操作された特徴を観察する。
本稿では,販売者の累積収益を最大化するために,購入者の戦略的行動をオンライン学習に取り入れた戦略的動的価格政策を提案する。
論文 参考訳(メタデータ) (2023-07-08T23:06:42Z) - Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。
報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。
次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文 参考訳(メタデータ) (2022-12-12T21:37:36Z) - Phase Transitions in Learning and Earning under Price Protection
Guarantee [4.683806391173103]
データ駆動型動的価格設定のためのオンライン学習アルゴリズムの設計にこのようなポリシーが与える影響について検討する。
最適な後悔は、まず基本的な不可能な体制を確立することで$tildeTheta(sqrtT+minM,,T2/3)$であることを示す。
我々は,下線プライス保護下でのアンダーライン学習とアンダーライン学習のための位相探索型アルゴリズムLEAPを提案する。
論文 参考訳(メタデータ) (2022-11-03T13:36:00Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Incrementality Bidding and Attribution [0.4511923587827302]
デジタル広告では、広告購入/入札/価格、帰属、実験という3つのパズルピースが、広告のインクリメンタル性を定量化する中心となる。
本稿では,これら3つの概念を,入札と帰属の双方の計算可能なモデルに統一する手法を提案する。
論文 参考訳(メタデータ) (2022-08-25T18:33:08Z) - Persuasion Strategies in Advertisements [68.70313043201882]
我々は,説得戦略の広範な語彙を導入し,説得戦略を付加した最初の広告画像コーパスを構築した。
次に,マルチモーダル学習による説得戦略予測のタスクを定式化する。
我々は、Fortune-500社の1600件の広告キャンペーンについて、現実世界でケーススタディを実施している。
論文 参考訳(メタデータ) (2022-08-20T07:33:13Z) - Personality-Driven Social Multimedia Content Recommendation [68.46899477180837]
人格特性がコンテンツレコメンデーションモデルに与える影響を,新しいパーソナリティ駆動型マルチビューコンテンツレコメンデーションシステムを適用して検討する。
実験結果と実世界のケーススタディは、PersiCが効率的な人格駆動型マルチビューコンテンツレコメンデーションを行う能力だけでなく、実用的なデジタル広告戦略レコメンデーションを可能にすることを実証している。
論文 参考訳(メタデータ) (2022-07-25T14:37:18Z) - Aspect-based Analysis of Advertising Appeals for Search Engine
Advertising [37.85305426549587]
我々は、広告作成プロセスを支援することを目的として、さまざまな業界で効果的なA$3を探索することに重点を置いている。
実験の結果,異なる産業がそれぞれA$3$を有し,A$3$の識別が広告効果の推定に寄与することが確認された。
論文 参考訳(メタデータ) (2022-04-25T05:31:07Z) - Towards Agnostic Feature-based Dynamic Pricing: Linear Policies vs
Linear Valuation with Unknown Noise [16.871660060209674]
我々は,$tildeO(Tfrac34)$の後悔を実現するアルゴリズムを示し,$Omega(Tfrac35)$から$tildeOmega(Tfrac23)$への最もよく知られた下限を改善する。
その結果, 弱い仮定の下では, 特徴量に基づく動的価格設定が可能であることが示唆された。
論文 参考訳(メタデータ) (2022-01-27T06:40:03Z) - A novel auction system for selecting advertisements in Real-Time bidding [68.8204255655161]
リアルタイム入札(Real-Time Bidding)は、インターネット広告システムで、近年非常に人気を集めている。
本稿では、経済的な側面だけでなく、広告システムの機能にかかわる他の要因も考慮した、新たなアプローチによる代替ベッティングシステムを提案する。
論文 参考訳(メタデータ) (2020-10-22T18:36:41Z) - Online-to-Offline Advertisements as Field Experiments [0.17877823660518105]
オンライン広告を受けた顧客と常連客のオフライン行動の違いについて検討した。
そして、この広告の外部性による長期的効果として、一部の顧客がオフライン店舗に招待された場合、これらの店舗を再訪する。
論文 参考訳(メタデータ) (2020-10-18T22:04:56Z) - Learning to Infer User Hidden States for Online Sequential Advertising [52.169666997331724]
本稿では,これらの問題に対処するディープインテントシーケンス広告(DISA)手法を提案する。
解釈可能性の鍵となる部分は、消費者の購入意図を理解することである。
論文 参考訳(メタデータ) (2020-09-03T05:12:26Z) - A Deep Prediction Network for Understanding Advertiser Intent and
Satisfaction [41.000912016821246]
本稿では,広告主の意図と満足度を同時にモデル化する新しいDeep Satisfaction Prediction Network (DSPN)を提案する。
提案するDSPNは,最先端のベースラインより優れ,オンライン環境におけるAUCの観点からも安定した性能を有する。
論文 参考訳(メタデータ) (2020-08-20T15:08:50Z) - Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential
Advertising [52.3825928886714]
我々は、動的knapsack問題として、シーケンシャルな広告戦略最適化を定式化する。
理論的に保証された二段階最適化フレームワークを提案し、元の最適化空間の解空間を大幅に削減する。
強化学習の探索効率を向上させるため,効果的な行動空間削減手法も考案した。
論文 参考訳(メタデータ) (2020-06-29T18:50:35Z) - Do Interruptions Pay Off? Effects of Interruptive Ads on Consumers
Willingness to Pay [79.9312329825761]
本研究は,広告主ブランドの商品に対する消費者の支払い意欲に及ぼす割り込み広告の影響を計測する研究結果である。
本研究は, 広告の経済的影響に関する研究に寄与し, 実験マーケティング研究における実際の(自己申告の)支払意欲を測定する方法を紹介した。
論文 参考訳(メタデータ) (2020-05-14T09:26:57Z) - Online Learning with Imperfect Hints [72.4277628722419]
オンライン学習において,不完全な方向ヒントを用いたアルゴリズムを開発し,ほぼ一致している。
我々のアルゴリズムはヒントの品質を損なうものであり、後悔の限界は常に相関するヒントの場合と隠れない場合とを補間する。
論文 参考訳(メタデータ) (2020-02-11T23:06:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。