論文の概要: Bid Shading by Win-Rate Estimation and Surplus Maximization
- arxiv url: http://arxiv.org/abs/2009.09259v1
- Date: Sat, 19 Sep 2020 15:46:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 21:12:47.304816
- Title: Bid Shading by Win-Rate Estimation and Surplus Maximization
- Title(参考訳): ウィンレート推定と余剰最大化によるバイドシェーディング
- Authors: Shengjun Pan, Brendan Kitts, Tian Zhou, Hao He, Bharatbhushan Shetty,
Aaron Flores, Djordje Gligorijevic, Junwei Pan, Tingyu Mao, San Gultekin and
Jianlong Zhang
- Abstract要約: 本稿では,SSP(Sell-Side Platform)の最小バイド・ツー・ウィンに依存しない新たなウィンレート型入札シェーディングアルゴリズム(WR)について述べる。
この方法は、変更されたロジスティック回帰を用いて、それぞれの日陰入札価格から利益を予測する。
本稿では,本手法による生産結果と,他のアルゴリズムについて報告する。
- 参考スコア(独自算出の注目度): 14.66045989500942
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes a new win-rate based bid shading algorithm (WR) that
does not rely on the minimum-bid-to-win feedback from a Sell-Side Platform
(SSP). The method uses a modified logistic regression to predict the profit
from each possible shaded bid price. The function form allows fast maximization
at run-time, a key requirement for Real-Time Bidding (RTB) systems. We report
production results from this method along with several other algorithms. We
found that bid shading, in general, can deliver significant value to
advertisers, reducing price per impression to about 55% of the unshaded cost.
Further, the particular approach described in this paper captures 7% more
profit for advertisers, than do benchmark methods of just bidding the most
probable winning price. We also report 4.3% higher surplus than an industry
Sell-Side Platform shading service. Furthermore, we observed 3% - 7% lower
eCPM, eCPC and eCPA when the algorithm was integrated with budget controllers.
We attribute the gains above as being mainly due to the explicit maximization
of the surplus function, and note that other algorithms can take advantage of
this same approach.
- Abstract(参考訳): 本稿では,SSP (Sell-Side Platform) の最小バイスフィードバックに依存しない新たなウィンレート型入札シェーディングアルゴリズム(WR)について述べる。
この方法は、変更されたロジスティック回帰を用いて、それぞれの日陰入札価格から利益を予測する。
関数形式はリアルタイムバイディング(RTB)システムのキー要件である実行時の高速な最大化を可能にする。
本手法による生産結果と他のアルゴリズムについて報告する。
入札シェーディングは一般的に広告主に大きな価値をもたらし、インプレッション当たりの価格を半額の約55%に下げることができた。
さらに、本論文で述べられている特定のアプローチは、最も高い利率を入札するベンチマーク手法よりも広告主の利益率を7%上回っている。
私たちはまた、業界販売側のプラットフォームシェーディングサービスよりも4.3%高い黒字を報告しています。
さらに,アルゴリズムを予算管理装置に統合した場合,eCPM,eCPC,eCPAは3%~7%低下した。
上記の利益は主に余剰関数の明示的な最大化によるものであり、他のアルゴリズムも同様のアプローチを活用できることに注意する。
関連論文リスト
- Procurement Auctions via Approximately Optimal Submodular Optimization [53.93943270902349]
競売業者がプライベートコストで戦略的売り手からサービスを取得しようとする競売について検討する。
我々の目標は、取得したサービスの品質と販売者の総コストとの差を最大化する計算効率の良いオークションを設計することである。
論文 参考訳(メタデータ) (2024-11-20T18:06:55Z) - Rate-Optimal Policy Optimization for Linear Markov Decision Processes [65.5958446762678]
最安値の$widetilde O (sqrt K)$ regret, $K$はエピソード数を表す。
我々の研究は、バンディットフィードバックのある設定において最適な収束率(w.r.t.$K$)を確立する最初のものである。
現在、最適なレート保証を持つアルゴリズムは知られていない。
論文 参考訳(メタデータ) (2023-08-28T15:16:09Z) - Dynamic Pricing and Learning with Bayesian Persuasion [18.59029578133633]
我々は,商品の価格設定に加えて,販売者が「広告計画」にコミットする,新たな動的価格設定と学習環境を考える。
我々は、バイエルンの一般的な説得フレームワークを使用して、これらのシグナルが購入者の評価と購入反応に与える影響をモデル化する。
我々は、過去の購入応答を利用して最適な価格と広告戦略を適応的に学習できるオンラインアルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-04-27T17:52:06Z) - Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。
報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。
次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文 参考訳(メタデータ) (2022-12-12T21:37:36Z) - A Reinforcement Learning Approach in Multi-Phase Second-Price Auction
Design [158.0041488194202]
多相第2価格オークションにおけるリザーブ価格の最適化について検討する。
売り手の視点からは、潜在的に非現実的な入札者の存在下で、環境を効率的に探索する必要がある。
第三に、売り手のステップごとの収益は未知であり、非線形であり、環境から直接観察することさえできない。
論文 参考訳(メタデータ) (2022-10-19T03:49:05Z) - Dynamic Budget Throttling in Repeated Second-Price Auctions [11.823210231891517]
スロットリングは人気のある選択であり、広告主の総支出を管理するために、オークションのサブセットだけを選択することで、広告主の総支出を管理する。
本稿では,2次価格の繰り返しオークションにおいて,単一の広告主の動的予算絞りプロセスの理論的パノラマを提供する。
本研究は, 競売におけるスロットリングの理論的研究のギャップを埋めるものであり, この一般的な予算平滑化戦略の能力を明らかにするものである。
論文 参考訳(メタデータ) (2022-07-11T08:12:02Z) - An Efficient Deep Distribution Network for Bid Shading in First-Price
Auctions [10.180752196357805]
オープン(非検閲)およびクローズド(検閲)オンラインファーストプライスオークションの両方において、最適な入札を行うための新しいディープ・ディストリビューション・ネットワークを導入する。
提案アルゴリズムは,動作毎の余剰と有効コスト(eCPX)の両方の観点から,従来の最先端アルゴリズムよりも優れている。
オンラインA/Bテストによると、広告主のROIは、インプレッションベース(CPM)、クリックベース(CPC)、コンバージョンベース(CPA)の各キャンペーンで+2.4%、+2.4%、+8.6%向上している。
論文 参考訳(メタデータ) (2021-07-12T22:44:39Z) - Efficient Algorithms for Stochastic Repeated Second-price Auctions [0.0]
我々は,繰り返し競売を行うための効率的な逐次入札戦略を開発する。
この問題に対する最初のパラメトリック下界を提供する。
本稿では,探索時コミット帯域幅アルゴリズムを思い起こさせる,より説明可能な戦略を提案する。
論文 参考訳(メタデータ) (2020-11-10T12:45:02Z) - Reserve Price Optimization for First Price Auctions [14.18752189817994]
本研究では, 入札者のリザーブ・ショックに対する応答性の推定値に基づいて, リザーブ・プライスを適応的に更新し, 最適化する勾配に基づくアルゴリズムを提案する。
第一価格オークションにおける収益は、オンデマンドコンポーネントとエンフビジンコンポーネントに分解することができ、各コンポーネントのばらつきを低減する技術を導入することができる。
論文 参考訳(メタデータ) (2020-06-11T15:35:19Z) - Optimistic Policy Optimization with Bandit Feedback [70.75568142146493]
我々は,事前の報奨を後悔する$tilde O(sqrtS2 A H4 K)を定め,楽観的な信頼領域ポリシー最適化(TRPO)アルゴリズムを提案する。
我々の知る限り、この2つの結果は、未知の遷移と帯域幅フィードバックを持つポリシー最適化アルゴリズムにおいて得られた最初のサブ線形後悔境界である。
論文 参考訳(メタデータ) (2020-02-19T15:41:18Z) - Provably Efficient Exploration in Policy Optimization [117.09887790160406]
本稿では,最適化アルゴリズム(OPPO)の最適変種を提案する。
OPPO は $tildeO(sqrtd2 H3 T )$ regret を達成する。
我々の知る限りでは、OPPOは、探索する最初の証明可能な効率的なポリシー最適化アルゴリズムである。
論文 参考訳(メタデータ) (2019-12-12T08:40:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。