Fugu-MT 論文翻訳(概要): Bandit Profit-maximization for Targeted Marketing

論文の概要: Bandit Profit-maximization for Targeted Marketing

arxiv url: http://arxiv.org/abs/2403.01361v1
Date: Sun, 3 Mar 2024 01:33:47 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-05 14:12:34.804589
Title: Bandit Profit-maximization for Targeted Marketing
Title（参考訳）: ターゲットマーケティングにおけるbandit利益の最大化
Authors: Joon Suk Huh, Ellen Vitercik, Kirthevasan Kandasamy
Abstract要約: 我々は、マーケティング支出のような価格変数と補助変数の両方を最適化し、逐次利益最大化問題を研究する。本結果は, 逆帯域設定におけるこの問題に対して, ほぼ最適アルゴリズムである。
参考スコア（独自算出の注目度）: 13.744589026936623
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We study a sequential profit-maximization problem, optimizing for both price and ancillary variables like marketing expenditures. Specifically, we aim to maximize profit over an arbitrary sequence of multiple demand curves, each dependent on a distinct ancillary variable, but sharing the same price. A prototypical example is targeted marketing, where a firm (seller) wishes to sell a product over multiple markets. The firm may invest different marketing expenditures for different markets to optimize customer acquisition, but must maintain the same price across all markets. Moreover, markets may have heterogeneous demand curves, each responding to prices and marketing expenditures differently. The firm's objective is to maximize its gross profit, the total revenue minus marketing costs. Our results are near-optimal algorithms for this class of problems in an adversarial bandit setting, where demand curves are arbitrary non-adaptive sequences, and the firm observes only noisy evaluations of chosen points on the demand curves. We prove a regret upper bound of $\widetilde{\mathcal{O}}\big(nT^{3/4}\big)$ and a lower bound of $\Omega\big((nT)^{3/4}\big)$ for monotonic demand curves, and a regret bound of $\widetilde{\Theta}\big(nT^{2/3}\big)$ for demands curves that are monotonic in price and concave in the ancillary variables.
Abstract（参考訳）: 利益の最大化問題を逐次検討し、マーケティング費などの価格と補助変数の両方に最適化する。具体的には、複数の需要曲線の任意の列に対して利益を最大化することを目的としており、それぞれが異なる補助変数に依存するが、同じ価格を共有する。原型的な例としてターゲットマーケティングがあり、企業(販売業者)が製品を複数の市場で販売することを望んでいる。同社は、顧客獲得を最適化するために異なる市場向けに異なるマーケティング支出を投資する可能性があるが、すべての市場にわたって同じ価格を維持する必要がある。さらに、市場は不均一な需要曲線を持ち、それぞれが価格やマーケティング支出が異なる。同社の目標は利益を最大化し、総収益はマーケティングコストを抑えることである。提案手法は, 需要曲線が任意の非適応シーケンスであり, 需要曲線上の選択点のノイズ評価のみを観測する, 逆バンディット設定におけるこの問題に対する近似最適アルゴリズムである。我々は、単調な需要曲線に対して、$\widetilde{\mathcal{O}}\big(nT^{3/4}\big)$と$\Omega\big((nT)^{3/4}\big)$と、単調な需要曲線に対して$\widetilde{\Theta}\big(nT^{2/3}\big)$の後悔の上限を、単調な価格で単調な需要曲線に対して$とする。

関連論文リスト

Optimal Nonlinear Online Learning under Sequential Price Competition via s-Concavity [24.586053819490985]
われわれは、複数の売り手の間での価格競争をT$の期間で検討している。売り手は価格を同時に提供し、それぞれの需要を競合相手に見つからないように監視する。すべての売り手が当社の政策を採用すると、その価格がナッシュ均衡価格に対して$O(T-1/7)のレートで収束し、もし売り手が十分に情報を得たらリーチできることが示される。
論文参考訳（メタデータ） (2025-03-20T22:51:03Z)
Dynamic Pricing with Adversarially-Censored Demands [25.566323930646178]
我々は,各時点における潜在需要が$t=1,2,ldots,T$であり,価格に依存するオンライン動的価格問題について検討する。一度に$t$が課せられ、在庫水準を超えた場合の潜在的な需要を検閲する。本アルゴリズムは,逆在庫級数であっても,$tildeO(sqrtT)$Optimative regretを達成できることを示す。
論文参考訳（メタデータ） (2025-02-10T05:37:39Z)
Fair Allocation in Dynamic Mechanism Design [57.66441610380448]
競売業者が各ラウンドの買い手グループに、合計で$T$で分けない商品を販売している問題を考える。競売人は、各グループの最低平均配分を保証する公正な制約に固執しつつ、割引された全体の収益を最大化することを目的としている。
論文参考訳（メタデータ） (2024-05-31T19:26:05Z)
Dynamic Pricing and Learning with Long-term Reference Effects [16.07344044662994]
本研究では,販売者が提示した過去の価格の基準価格が平均値となる,シンプルで斬新な参照価格メカニズムについて検討する。このメカニズムの下では,モデルパラメータに関係なく,マークダウンポリシがほぼ最適であることを示す。次に、需要モデルパラメータが不明な、より困難な動的価格と学習の問題について検討する。
論文参考訳（メタデータ） (2024-02-19T21:36:54Z)
Transformers as Support Vector Machines [54.642793677472724]
自己アテンションの最適化幾何と厳密なSVM問題との間には,形式的等価性を確立する。勾配降下に最適化された1層変圧器の暗黙バイアスを特徴付ける。これらの発見は、最適なトークンを分離し選択するSVMの階層としてのトランスフォーマーの解釈を刺激していると信じている。
論文参考訳（メタデータ） (2023-08-31T17:57:50Z)
Dynamic Pricing and Learning with Bayesian Persuasion [18.59029578133633]
我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境を考える。我々は、バイエルンの一般的な説得フレームワークを使用して、これらのシグナルが購入者の評価と購入反応に与える影響をモデル化する。我々は、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計する。
論文参考訳（メタデータ） (2023-04-27T17:52:06Z)
Finding Regularized Competitive Equilibria of Heterogeneous Agent Macroeconomic Models with Reinforcement Learning [151.03738099494765]
労働市場に参入する世帯や企業を無限に数える異種エージェントマクロ経済モデルについて検討する。本稿では,モデルの正規化競争均衡を求めるデータ駆動強化学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-02-24T17:16:27Z)
Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文参考訳（メタデータ） (2022-12-12T21:37:36Z)
Quantum computational finance: martingale asset pricing for incomplete markets [69.73491758935712]
金融の価格問題に様々な量子技術を適用することができることを示す。従来の研究と異なる3つの方法について議論する。
論文参考訳（メタデータ） (2022-09-19T09:22:01Z)
Learning Underspecified Models [0.0]
本稿では,環境の真の仕様を知りながら,最適な動作を学べるかどうかを検討する。データに基づいて最適な価格を予測するアルゴリズムとして学習力学を定式化する。 PAC学習性にインスパイアされた我々は,アルゴリズムが正確な予測を生成する必要があることを要求して,学習可能性の新しい概念を開発する。
論文参考訳（メタデータ） (2022-07-20T18:42:29Z)
Multi-Asset Spot and Option Market Simulation [52.77024349608834]
正規化フローに基づく1つの基盤となる1つのマーケットシミュレータを現実的に構築する。本研究では, 正規化流れの条件付き可逆性を活用し, 独立シミュレータの連立分布をキャリブレーションするスケーラブルな手法を提案する。
論文参考訳（メタデータ） (2021-12-13T17:34:28Z)
Policy Optimization Using Semiparametric Models for Dynamic Pricing [1.3428344011390776]
商品の市場価値が観測された特徴と市場ノイズに線形である状況的動的価格問題について検討する。一般化線形モデルからの半パラメトリック推定と未知のリンクとオンライン意思決定を組み合わせた動的統計的学習と意思決定ポリシーを提案する。
論文参考訳（メタデータ） (2021-09-13T23:50:01Z)
Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文参考訳（メタデータ） (2021-06-05T09:16:28Z)
Dynamic Pricing and Learning under the Bass Model [16.823029377470366]
マーケットサイズが$m$である場合、オーダー$tilde O(m2/3)$の確率後悔保証を満足するアルゴリズムを開発する。多くの後悔の分析結果とは異なり、現在の問題では市場規模$m$が複雑さの基本的な要因である。
論文参考訳（メタデータ） (2021-03-09T03:27:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。