論文の概要: Stochastic Bandits for Multi-platform Budget Optimization in Online
- arxiv url: http://arxiv.org/abs/2103.10246v1
- Date: Tue, 16 Mar 2021 22:10:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-19 13:52:01.561951
- Title: Stochastic Bandits for Multi-platform Budget Optimization in Online
- Title(参考訳): オンライン広告におけるマルチプラットフォーム予算最適化のための確率帯域
- Authors: Vashist Avadhanula, Riccardo Colini-Baldeschi, Stefano Leonardi,
Karthik Abinav Sankararaman, Okke Schrijvers
- Abstract要約: 我々は、複数のプラットフォームでキャンペーンのために広告主の与えられた予算を最適に費やしたいオンライン広告システムの問題を研究します。
- 参考スコア(独自算出の注目度): 8.8896707993459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of an online advertising system that wants to optimally
spend an advertiser's given budget for a campaign across multiple platforms,
without knowing the value for showing an ad to the users on those platforms. We
model this challenging practical application as a Stochastic Bandits with
Knapsacks problem over $T$ rounds of bidding with the set of arms given by the
set of distinct bidding $m$-tuples, where $m$ is the number of platforms. We
modify the algorithm proposed in Badanidiyuru \emph{et al.,} to extend it to
the case of multiple platforms to obtain an algorithm for both the discrete and
continuous bid-spaces. Namely, for discrete bid spaces we give an algorithm
with regret $O\left(OPT \sqrt {\frac{mn}{B} }+ \sqrt{mn OPT}\right)$, where
$OPT$ is the performance of the optimal algorithm that knows the distributions.
For continuous bid spaces the regret of our algorithm is
$\tilde{O}\left(m^{1/3} \cdot \min\left\{ B^{2/3}, (m T)^{2/3} \right\}
\right)$. When restricted to this special-case, this bound improves over
Sankararaman and Slivkins in the regime $OPT \ll T$, as is the case in the
particular application at hand. Second, we show an $ \Omega\left (\sqrt {m OPT}
\right)$ lower bound for the discrete case and an $\Omega\left( m^{1/3}
B^{2/3}\right)$ lower bound for the continuous setting, almost matching the
upper bounds. Finally, we use a real-world data set from a large internet
online advertising company with multiple ad platforms and show that our
algorithms outperform common benchmarks and satisfy the required properties
warranted in the real-world application.
- Abstract(参考訳): 我々は,複数のプラットフォームにまたがる広告キャンペーンにおいて,広告主の予算を最適に利用しようとするオンライン広告システムの問題について,それらのプラットフォーム上でユーザに対して広告を表示する価値を知らずに検討する。
我々は、badanidiyuru \emph{et al.,} で提案するアルゴリズムを複数のプラットフォームに拡張し、離散入札空間と連続入札空間の両方のアルゴリズムを得る。
すなわち、離散入札空間に対して、後悔するアルゴリズムに$o\left(opt \sqrt {\frac{mn}{b} }+ \sqrt{mn opt}\right)$を与え、ここで$opt$は分布を知る最適なアルゴリズムの性能である。
連続入札空間に対しては、我々のアルゴリズムの後悔は$\tilde{O}\left(m^{1/3} \cdot \min\left\{ B^{2/3}, (m T)^{2/3} \right\right)$である。
この特別なケースに制限された場合、このバウンダリは、手元にある特定のアプリケーションの場合と同様に、体制$OPT \ll T$のサンカラマンとスリブキンスよりも改善される。
第二に、離散ケースに対する$ \Omega\left (\sqrt {m OPT} \right)$下界と連続設定に対する$ \Omega\left(m^{1/3} B^{2/3}\right)$下界を示し、上界とほぼ一致する。
