論文の概要: Bandit Profit-maximization for Targeted Marketing
- arxiv url: http://arxiv.org/abs/2403.01361v1
- Date: Sun, 3 Mar 2024 01:33:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 14:12:34.804589
- Title: Bandit Profit-maximization for Targeted Marketing
- Title(参考訳): ターゲットマーケティングにおけるbandit利益の最大化
- Authors: Joon Suk Huh, Ellen Vitercik, Kirthevasan Kandasamy
- Abstract要約: 我々は、マーケティング支出のような価格変数と補助変数の両方を最適化し、逐次利益最大化問題を研究する。
本結果は, 逆帯域設定におけるこの問題に対して, ほぼ最適アルゴリズムである。
- 参考スコア(独自算出の注目度): 13.744589026936623
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study a sequential profit-maximization problem, optimizing for both price
and ancillary variables like marketing expenditures. Specifically, we aim to
maximize profit over an arbitrary sequence of multiple demand curves, each
dependent on a distinct ancillary variable, but sharing the same price. A
prototypical example is targeted marketing, where a firm (seller) wishes to
sell a product over multiple markets. The firm may invest different marketing
expenditures for different markets to optimize customer acquisition, but must
maintain the same price across all markets. Moreover, markets may have
heterogeneous demand curves, each responding to prices and marketing
expenditures differently. The firm's objective is to maximize its gross profit,
the total revenue minus marketing costs.
Our results are near-optimal algorithms for this class of problems in an
adversarial bandit setting, where demand curves are arbitrary non-adaptive
sequences, and the firm observes only noisy evaluations of chosen points on the
demand curves. We prove a regret upper bound of
$\widetilde{\mathcal{O}}\big(nT^{3/4}\big)$ and a lower bound of
$\Omega\big((nT)^{3/4}\big)$ for monotonic demand curves, and a regret bound of
$\widetilde{\Theta}\big(nT^{2/3}\big)$ for demands curves that are monotonic in
price and concave in the ancillary variables.
- Abstract(参考訳): 利益の最大化問題を逐次検討し、マーケティング費などの価格と補助変数の両方に最適化する。
具体的には、複数の需要曲線の任意の列に対して利益を最大化することを目的としており、それぞれが異なる補助変数に依存するが、同じ価格を共有する。
原型的な例としてターゲットマーケティングがあり、企業(販売業者)が製品を複数の市場で販売することを望んでいる。
同社は、顧客獲得を最適化するために異なる市場向けに異なるマーケティング支出を投資する可能性があるが、すべての市場にわたって同じ価格を維持する必要がある。
さらに、市場は不均一な需要曲線を持ち、それぞれが価格やマーケティング支出が異なる。
同社の目標は利益を最大化し、総収益はマーケティングコストを抑えることである。
提案手法は, 需要曲線が任意の非適応シーケンスであり, 需要曲線上の選択点のノイズ評価のみを観測する, 逆バンディット設定におけるこの問題に対する近似最適アルゴリズムである。
我々は、単調な需要曲線に対して、$\widetilde{\mathcal{O}}\big(nT^{3/4}\big)$と$\Omega\big((nT)^{3/4}\big)$と、単調な需要曲線に対して$\widetilde{\Theta}\big(nT^{2/3}\big)$の後悔の上限を、単調な価格で単調な需要曲線に対して$とする。
関連論文リスト
- From Stream to Pool: Dynamic Pricing Beyond i.i.d. Arrivals [6.3305050339413675]
適応的でないポリシーを効率的に計算するミニマックス近位アルゴリズムを提案する。
また,新しいエンフェデビアス法に基づく適応型エンフェレーンアーン政策を提案する。
論文 参考訳(メタデータ) (2023-10-30T01:53:37Z) - Dynamic Pricing and Learning with Bayesian Persuasion [18.59029578133633]
我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境を考える。
我々は、バイエルンの一般的な説得フレームワークを使用して、これらのシグナルが購入者の評価と購入反応に与える影響をモデル化する。
我々は、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-04-27T17:52:06Z) - Variance-Dependent Regret Bounds for Linear Bandits and Reinforcement
Learning: Adaptivity and Computational Efficiency [90.40062452292091]
本稿では,不整合雑音を持つ線形帯域に対する計算効率のよい最初のアルゴリズムを提案する。
我々のアルゴリズムは未知のノイズの分散に適応し、$tildeO(d sqrtsum_k = 1K sigma_k2 + d)$ regretを達成する。
また、強化学習において、線形混合マルコフ決定過程(MDP)に対する分散適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-21T00:17:24Z) - Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。
報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。
次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文 参考訳(メタデータ) (2022-12-12T21:37:36Z) - Quantum computational finance: martingale asset pricing for incomplete
markets [69.73491758935712]
金融の価格問題に様々な量子技術を適用することができることを示す。
従来の研究と異なる3つの方法について議論する。
論文 参考訳(メタデータ) (2022-09-19T09:22:01Z) - Causal Bandits for Linear Structural Equation Models [58.2875460517691]
本稿では,因果図形モデルにおける最適な介入順序を設計する問題について検討する。
グラフの構造は知られており、ノードは$N$である。
頻繁性(UCBベース)とベイズ的設定に2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-26T16:21:31Z) - Learning Underspecified Models [0.0]
本稿では,環境の真の仕様を知りながら,最適な動作を学べるかどうかを検討する。
データに基づいて最適な価格を予測するアルゴリズムとして学習力学を定式化する。
PAC学習性にインスパイアされた我々は,アルゴリズムが正確な予測を生成する必要があることを要求して,学習可能性の新しい概念を開発する。
論文 参考訳(メタデータ) (2022-07-20T18:42:29Z) - Policy Optimization Using Semiparametric Models for Dynamic Pricing [1.3428344011390776]
商品の市場価値が観測された特徴と市場ノイズに線形である状況的動的価格問題について検討する。
一般化線形モデルからの半パラメトリック推定と未知のリンクとオンライン意思決定を組み合わせた動的統計的学習と意思決定ポリシーを提案する。
論文 参考訳(メタデータ) (2021-09-13T23:50:01Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - Dynamic Pricing and Learning under the Bass Model [16.823029377470366]
マーケットサイズが$m$である場合、オーダー$tilde O(m2/3)$の確率後悔保証を満足するアルゴリズムを開発する。
多くの後悔の分析結果とは異なり、現在の問題では市場規模$m$が複雑さの基本的な要因である。
論文 参考訳(メタデータ) (2021-03-09T03:27:33Z) - Variance-Aware Confidence Set: Variance-Dependent Bound for Linear
Bandits and Horizon-Free Bound for Linear Mixture MDP [76.94328400919836]
線形バンドイットと線形混合決定プロセス(mdp)に対する分散認識信頼セットの構築方法を示す。
線形バンドイットに対しては、$d を特徴次元とする$widetildeo(mathrmpoly(d)sqrt1 + sum_i=1ksigma_i2) が成り立つ。
線形混合 MDP に対し、$widetildeO(mathrmpoly(d)sqrtK)$ regret bound を得る。
論文 参考訳(メタデータ) (2021-01-29T18:57:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。