論文の概要: Robust Budget Pacing with a Single Sample
- arxiv url: http://arxiv.org/abs/2302.02006v1
- Date: Fri, 3 Feb 2023 21:23:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 20:52:34.163387
- Title: Robust Budget Pacing with a Single Sample
- Title(参考訳): 単一サンプルによるロバストな予算ペーシング
- Authors: Santiago Balseiro, Rachitesh Kumar, Vahab Mirrokni, Balasubramanian
Sivan, Di Wang
- Abstract要約: ほぼ最適の$tilde O(sqrtT)$-regretを達成するのに、分布毎に1つのサンプルだけで十分であることを示す。
ほぼ最適の$tilde O(sqrtT)$-regretを達成するのに、分布毎に1つのサンプルだけで十分であることを示す。
- 参考スコア(独自算出の注目度): 9.826939499674676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Major Internet advertising platforms offer budget pacing tools as a standard
service for advertisers to manage their ad campaigns. Given the inherent
non-stationarity in an advertiser's value and also competing advertisers'
values over time, a commonly used approach is to learn a target expenditure
plan that specifies a target spend as a function of time, and then run a
controller that tracks this plan. This raises the question: how many historical
samples are required to learn a good expenditure plan? We study this question
by considering an advertiser repeatedly participating in $T$ second-price
auctions, where the tuple of her value and the highest competing bid is drawn
from an unknown time-varying distribution. The advertiser seeks to maximize her
total utility subject to her budget constraint. Prior work has shown the
sufficiency of $T\log T$ samples per distribution to achieve the optimal
$O(\sqrt{T})$-regret. We dramatically improve this state-of-the-art and show
that just one sample per distribution is enough to achieve the near-optimal
$\tilde O(\sqrt{T})$-regret, while still being robust to noise in the sampling
distributions.
- Abstract(参考訳): 主要なインターネット広告プラットフォームは、広告主が広告キャンペーンを管理するための標準サービスとして予算調整ツールを提供している。
広告主の価値と競合する広告主の価値観に固有の非定常性を考えると、一般的に使用されるアプローチは、目標支出を時間の関数として指定した目標支出計画を学び、その計画を追跡するコントローラを実行することである。
良質な支出計画を学ぶために、どのくらいの歴史的サンプルが必要か?
本研究では,その価格と競争入札額のタプルが未知の時間変動分布から引き出されるような,第2価格のオークションに繰り返し参加する広告主について検討する。
広告主は、予算制約の対象となる全ユーティリティを最大化しようとします。
以前の研究は、最適な$o(\sqrt{t})$-regretを達成するために、分布あたりの$t\log t$サンプルの十分性を示した。
我々は、この最先端を劇的に改善し、サンプリング分布のノイズに対して頑健でありながら、ほぼ最適の$\tilde O(\sqrt{T})$-regretを達成するのに十分であることを示す。
関連論文リスト
- Know in AdVance: Linear-Complexity Forecasting of Ad Campaign Performance with Evolving User Interest [31.40023913908308]
リアルタイム入札(RTB)の広告主は、試行錯誤の費用を避けるために、予想されるコストと利益を事前にテキスト化したいと願っている。
ローカルオークションとグローバルキャンペーンレベルのモデリングを統合したタイムアウェアフレームワークである textitAdVance を提案する。
AdVanceはTencent Advertisingプラットフォームにデプロイされており、A/Bテストでは平均ユーザ当たり売上(ARPU)が4.5%上昇している。
論文 参考訳(メタデータ) (2024-05-17T10:22:36Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - Optimal Spend Rate Estimation and Pacing for Ad Campaigns with Budgets [6.870572485624023]
本稿では、時間によって異なる印象と競争の2つのモデルについて考察する。
本稿では,支出計画の正確性と,その結果のエンドツーエンドの予算管理システムの双方について,最初の学習理論的保証を示す。
論文 参考訳(メタデータ) (2022-02-04T20:18:00Z) - Fast Rate Learning in Stochastic First Price Bidding [0.0]
ファーストプライスのオークションは、プログラム広告におけるビックレーのオークションに基づく伝統的な入札アプローチを大きく置き換えている。
対戦相手の最大入札分布が分かっている場合, 後悔度を著しく低くする方法を示す。
我々のアルゴリズムは、様々な入札分布の文献で提案されている選択肢よりもはるかに高速に収束する。
論文 参考訳(メタデータ) (2021-07-05T07:48:52Z) - A novel auction system for selecting advertisements in Real-Time bidding [68.8204255655161]
リアルタイム入札(Real-Time Bidding)は、インターネット広告システムで、近年非常に人気を集めている。
本稿では、経済的な側面だけでなく、広告システムの機能にかかわる他の要因も考慮した、新たなアプローチによる代替ベッティングシステムを提案する。
論文 参考訳(メタデータ) (2020-10-22T18:36:41Z) - A Provably Efficient Sample Collection Strategy for Reinforcement
Learning [123.69175280309226]
オンライン強化学習(RL)における課題の1つは、エージェントがその振る舞いを最適化するために、環境の探索とサンプルの活用をトレードオフする必要があることである。
1) 生成モデル(環境のスパースシミュレータなど)にアクセス可能な状態のサンプル数を規定する「対象別」アルゴリズム,2) 所定のサンプルをできるだけ早く生成する「対象別」サンプル収集。
論文 参考訳(メタデータ) (2020-07-13T15:17:35Z) - Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential
Advertising [52.3825928886714]
我々は、動的knapsack問題として、シーケンシャルな広告戦略最適化を定式化する。
理論的に保証された二段階最適化フレームワークを提案し、元の最適化空間の解空間を大幅に削減する。
強化学習の探索効率を向上させるため,効果的な行動空間削減手法も考案した。
論文 参考訳(メタデータ) (2020-06-29T18:50:35Z) - Optimal Bidding Strategy without Exploration in Real-time Bidding [14.035270361462576]
予算制約によるユーティリティの最大化は、リアルタイム入札(RTB)システムにおける広告主の主要な目標である。
それまでの作品は、検閲された国家の困難を和らげるために競売に敗れたことを無視していた。
本稿では,リアルタイムトラフィックで観測される真の分布の挙動を模倣するために,最大エントロピー原理を用いた新しい実用的枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-31T20:43:28Z) - Online Joint Bid/Daily Budget Optimization of Internet Advertising
Campaigns [115.96295568115251]
複数のチャンネルにまたがるペイ・パー・クリック広告キャンペーンのオンライン共同入札/日次予算最適化の自動化問題について検討する。
どのキャンペーンでも、Gaussian Processesによる入札のクリック数と日々の予算に依存しています。
我々は4つのアルゴリズムを設計し、O(sqrtT)として高い確率で上界した後悔に苦しむことを示す。
我々は,1年以上に1日平均1000ユーロを消費した実世界のアプリケーションにおいて,我々のアルゴリズムの採用結果を提示する。
論文 参考訳(メタデータ) (2020-03-03T11:07:38Z) - Adversarial Attacks on Linear Contextual Bandits [87.08004581867537]
悪意のあるエージェントは、望ましい行動を実行するためにバンディットアルゴリズムを攻撃するインセンティブを持つ可能性がある。
悪意のあるエージェントは、線形コンテキストのバンドイットアルゴリズムに任意のアーム$T - o(T)$倍を$T$ステップで引き出すように強制することができる。
また,悪意のあるエージェントが単一コンテキストにおける帯域幅アルゴリズムの動作に影響を与えることに関心がある場合についても検討する。
論文 参考訳(メタデータ) (2020-02-10T15:04:09Z) - Scalable Bid Landscape Forecasting in Real-time Bidding [12.692521867728091]
プログラム広告では、広告スロットは通常、第二価格(SP)オークションを使ってリアルタイムで販売される。
SPでは、1つの項目に対して、各入札者の支配的な戦略は、入札者の視点から真の価値を入札することである。
本稿では,ヘテロセダスティックな完全パラメトリック・レグレッション・アプローチと混合密度・レグレッション・ネットワークを提案する。
論文 参考訳(メタデータ) (2020-01-18T03:20:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。