論文の概要: Advertising Media and Target Audience Optimization via High-dimensional
Bandits
- arxiv url: http://arxiv.org/abs/2209.08403v1
- Date: Sat, 17 Sep 2022 21:00:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 20:08:07.000070
- Title: Advertising Media and Target Audience Optimization via High-dimensional
Bandits
- Title(参考訳): 高次元バンディットによる広告メディアとターゲットオーディエンス最適化
- Authors: Wenjia Ba, J. Michael Harrison, Harikesh S. Nair
- Abstract要約: 我々は、広告主がオンラインパブリッシャーのデジタル広告管理を自動化するために利用できるデータ駆動アルゴリズムを提案する。
このアルゴリズムにより、広告主は利用可能なターゲットオーディエンスと広告メディアをまたいで検索し、オンライン実験を通じてキャンペーンの最良の組み合わせを見つけることができる。
- 参考スコア(独自算出の注目度): 2.5137859989323537
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a data-driven algorithm that advertisers can use to automate their
digital ad-campaigns at online publishers. The algorithm enables the advertiser
to search across available target audiences and ad-media to find the best
possible combination for its campaign via online experimentation. The problem
of finding the best audience-ad combination is complicated by a number of
distinctive challenges, including (a) a need for active exploration to resolve
prior uncertainty and to speed the search for profitable combinations, (b) many
combinations to choose from, giving rise to high-dimensional search
formulations, and (c) very low success probabilities, typically just a fraction
of one percent. Our algorithm (designated LRDL, an acronym for Logistic
Regression with Debiased Lasso) addresses these challenges by combining four
elements: a multiarmed bandit framework for active exploration; a Lasso penalty
function to handle high dimensionality; an inbuilt debiasing kernel that
handles the regularization bias induced by the Lasso; and a semi-parametric
regression model for outcomes that promotes cross-learning across arms. The
algorithm is implemented as a Thompson Sampler, and to the best of our
knowledge, it is the first that can practically address all of the challenges
above. Simulations with real and synthetic data show the method is effective
and document its superior performance against several benchmarks from the
recent high-dimensional bandit literature.
- Abstract(参考訳): 我々は、広告主がオンラインパブリッシャーのデジタル広告管理を自動化するために利用できるデータ駆動アルゴリズムを提案する。
このアルゴリズムは、広告主が利用可能なターゲットオーディエンスと広告メディアを検索して、オンライン実験を通じてキャンペーンの最良の組み合わせを見つけることができる。
最高のオーディエンスとadの組み合わせを見つけるという問題は、いくつかの異なる課題によって複雑である。
(a)事前の不確実性を解消し、利益のある組み合わせの探索を早めるための積極的な探索の必要性。
(b)選択すべき組み合わせが多数あり、高次元探索定式化がもたらされ、
(c) 成功確率が非常に低く、通常は1%に過ぎません。
我々のアルゴリズム(LRDL、Debiased Lassoによるロジスティック回帰の頭字語)は、アクティブな探索のためのマルチアームバンディットフレームワーク、高次元の処理を行うLassoペナルティ関数、Lassoによって誘導される正規化バイアスを処理する組み込みのデバイアスカーネル、腕間のクロスラーニングを促進する結果のためのセミパラメトリック回帰モデル、の4つの要素を組み合わせることで、これらの課題に対処する。
このアルゴリズムはトンプソン・サンプラーとして実装されており、私たちの知る限りでは、上記のすべての課題を実際に解決できるのはこれが初めてです。
実データおよび合成データを用いたシミュレーションは,本手法が有効であることを示し,最近の高次元バンディット文献のいくつかのベンチマークに対して優れた性能を示す。
関連論文リスト
- Double Matching Under Complementary Preferences [18.03464967426957]
本稿では,市場を補完的な選好でマッチングする問題に対処する新しいアルゴリズムを提案する。
相補的な選好の存在は、マッチングプロセスにおける不安定をもたらす可能性がある。
このアルゴリズムは、トンプソンサンプリングの強度を二重マッチング手法と組み合わせて、安定したマッチング結果を得る。
論文 参考訳(メタデータ) (2023-01-24T18:54:29Z) - Incentivizing Combinatorial Bandit Exploration [87.08827496301839]
自己関心のあるユーザに対してレコメンデーションシステムでアクションを推奨するバンディットアルゴリズムを考える。
ユーザーは他のアクションを自由に選択でき、アルゴリズムの推奨に従うためにインセンティブを得る必要がある。
ユーザは悪用を好むが、アルゴリズムは、前のユーザから収集した情報を活用することで、探索にインセンティブを与えることができる。
論文 参考訳(メタデータ) (2022-06-01T13:46:25Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - Approximate Nearest Neighbor Search under Neural Similarity Metric for
Large-Scale Recommendation [20.42993976179691]
本稿では,任意のマッチング関数にANN探索を拡張する新しい手法を提案する。
我々の主な考えは、すべての項目から構築された類似性グラフに一致する関数で、欲張りのウォークを実行することである。
提案手法は,Taobaoのディスプレイ広告プラットフォームに完全に展開されており,広告収入の大幅な増加をもたらす。
論文 参考訳(メタデータ) (2022-02-14T07:55:57Z) - Generalizable Mixed-Precision Quantization via Attribution Rank
Preservation [90.26603048354575]
効率的な推論のための一般化可能な混合精度量子化法(GMPQ)を提案する。
提案手法は,最先端の混合精度ネットワークと比較し,競合精度・複雑度トレードオフを求める。
論文 参考訳(メタデータ) (2021-08-05T16:41:57Z) - MURAL: Meta-Learning Uncertainty-Aware Rewards for Outcome-Driven
Reinforcement Learning [65.52675802289775]
本研究では,不確かさを意識した分類器が,強化学習の難しさを解消できることを示す。
正規化最大度(NML)分布の計算法を提案する。
得られたアルゴリズムは、カウントベースの探索法と、報酬関数を学習するための先行アルゴリズムの両方に多くの興味深い関係を持つことを示す。
論文 参考訳(メタデータ) (2021-07-15T08:19:57Z) - Multi-resource allocation for federated settings: A non-homogeneous
Markov chain model [2.552459629685159]
連合設定において、エージェントは中央エージェントまたはサーバと協調し、エージェントが互いに情報を共有しない最適化問題を解決する。
本稿では,アジェント間通信のない単一共有リソースのフェデレーション設定における最適化問題のクラスを解決するために,AIMDアルゴリズムを簡単な方法で変更する方法について述べる。
シングルリソースのアルゴリズムを、スマートシティや共有エコノミー、その他多くのアプリケーションに出現する複数の異種共有リソースに拡張する。
論文 参考訳(メタデータ) (2021-04-26T19:10:00Z) - Doubly-Adaptive Thompson Sampling for Multi-Armed and Contextual Bandits [28.504921333436833]
本稿では,トンプソンサンプリングに基づくアルゴリズムの変種について,両腕の真の平均報酬に対する2倍頑健な推定器の項を適応的に再検討する。
提案アルゴリズムは, 半合成実験における最適(最小)後悔率とその経験的評価に適合する。
このアプローチは、適応データ収集とは別に、より多くのバイアス源が存在するコンテキスト的包帯に拡張する。
論文 参考訳(メタデータ) (2021-02-25T22:29:25Z) - Optimizing Offer Sets in Sub-Linear Time [5.027714423258537]
本稿では,各項目数のサブ線形時間内で動作するパーソナライズされたオファーセット最適化アルゴリズムを提案する。
私たちのアルゴリズムは完全にデータ駆動で、ユーザーのサンプルに依存します。
論文 参考訳(メタデータ) (2020-11-17T13:02:56Z) - Similarity Search for Efficient Active Learning and Search of Rare
Concepts [78.5475382904847]
我々は,現在ラベル付けされている集合の近傍にラベル付けする候補プールを制限することにより,能動的学習と探索法の計算効率を向上する。
提案手法は,従来のグローバルアプローチと同じような平均精度とリコールを実現し,選択の計算コストを最大3桁まで削減し,Webスケールのアクティブラーニングを可能にした。
論文 参考訳(メタデータ) (2020-06-30T19:46:10Z) - Learning to Accelerate Heuristic Searching for Large-Scale Maximum
Weighted b-Matching Problems in Online Advertising [51.97494906131859]
バイパルタイトbマッチングはアルゴリズム設計の基本であり、経済市場や労働市場などに広く適用されている。
既存の正確で近似的なアルゴリズムは、通常そのような設定で失敗する。
我々は、以前の事例から学んだ知識を活用して、新しい問題インスタンスを解決するtextttNeuSearcherを提案する。
論文 参考訳(メタデータ) (2020-05-09T02:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。