論文の概要: Impression Allocation and Policy Search in Display Advertising
- arxiv url: http://arxiv.org/abs/2203.07073v1
- Date: Fri, 11 Mar 2022 08:55:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-15 17:18:55.775121
- Title: Impression Allocation and Policy Search in Display Advertising
- Title(参考訳): ディスプレイ広告における印象割当とポリシー検索
- Authors: Di Wu and Cheng Chen and Xiujun Chen and Junwei Pan and Xun Yang and
Qing Tan and Jian Xu and Kuang-Chih Lee
- Abstract要約: オンラインディスプレイ広告では、保証契約とリアルタイム入札(RTB)が出版社にインプレッションを売る主要な方法である。
保証された各契約が個々のインプレッションに対して仮想入札を提出するオークション問題としてインプレッションアロケーションを定式化する。
保証された各契約からの入札を調整するためのマルチエージェント強化学習手法を提案する。
- 参考スコア(独自算出の注目度): 20.665879360586448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In online display advertising, guaranteed contracts and real-time bidding
(RTB) are two major ways to sell impressions for a publisher. For large
publishers, simultaneously selling impressions through both guaranteed
contracts and in-house RTB has become a popular choice. Generally speaking, a
publisher needs to derive an impression allocation strategy between guaranteed
contracts and RTB to maximize its overall outcome (e.g., revenue and/or
impression quality). However, deriving the optimal strategy is not a trivial
task, e.g., the strategy should encourage incentive compatibility in RTB and
tackle common challenges in real-world applications such as unstable traffic
patterns (e.g., impression volume and bid landscape changing). In this paper,
we formulate impression allocation as an auction problem where each guaranteed
contract submits virtual bids for individual impressions. With this
formulation, we derive the optimal bidding functions for the guaranteed
contracts, which result in the optimal impression allocation. In order to
address the unstable traffic pattern challenge and achieve the optimal overall
outcome, we propose a multi-agent reinforcement learning method to adjust the
bids from each guaranteed contract, which is simple, converging efficiently and
scalable. The experiments conducted on real-world datasets demonstrate the
effectiveness of our method.
- Abstract(参考訳): オンラインディスプレイ広告では、保証契約とリアルタイム入札(RTB)が出版社にインプレッションを売る主要な方法である。
大手出版社では、保証契約と社内rtbの両方を通じて同時にインプレッションを販売することが人気となっている。
一般的に言って、出版社は保証契約とrtbの間の印象配分戦略を導出して、全体的な結果(例えば、収益および/または印象品質)を最大化する必要がある。
しかし、最適な戦略を導出することは簡単な作業ではなく、例えば、RTBにおけるインセンティブの適合を奨励し、不安定な交通パターン(例えば、印象量や入札状況の変化)のような現実のアプリケーションにおける共通の課題に取り組むべきである。
本稿では,各契約が個別のインプレッションに対して仮想入札を行うオークション問題として,インプレッション割り当てを定式化する。
この定式化により、保証契約の最適入札関数が導出され、その結果、最適な印象割り当てが得られる。
不安定なトラフィックパターンの課題に対処し、最適な総合的な結果を達成するために、保証された各契約からの入札を調整するためのマルチエージェント強化学習手法を提案する。
実世界のデータセットを用いて実験を行い,本手法の有効性を実証した。
関連論文リスト
- Learning Multi-Agent Intention-Aware Communication for Optimal
Multi-Order Execution in Finance [96.73189436721465]
まず,現実的な制約を考慮したマルチオーダー実行のためのマルチエージェントRL(MARL)手法を提案する。
本稿では,学習可能なマルチラウンド通信プロトコルを提案する。
2つの実世界の市場のデータに関する実験では、優れたパフォーマンスを示し、コラボレーションの有効性が著しく向上した。
論文 参考訳(メタデータ) (2023-07-06T16:45:40Z) - Bidding Strategies for Proportional Representation in Advertisement
Campaigns [8.269283912626873]
同一入札は、異なる種類の個人に対する不均一な競争のレベルが原因で、等質な結果が得られないことが示される。
プラットフォームメカニズムを変更しない変更を検討し、代わりに広告主が使用する入札戦略を変更します。
論文 参考訳(メタデータ) (2023-05-22T23:29:05Z) - Functional Optimization Reinforcement Learning for Real-Time Bidding [14.5826735379053]
リアルタイム入札はプログラム広告の新しいパラダイムである。
既存のアプローチは、入札最適化に十分なソリューションを提供するのに苦労しています。
本稿では,機能最適化を伴うRTBのためのマルチエージェント強化学習アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-06-25T06:12:17Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - A Unified Framework for Campaign Performance Forecasting in Online
Display Advertising [9.005665883444902]
解釈可能で正確な結果により、広告主はキャンペーン基準を管理し、最適化することができる。
新しいフレームワークは、様々な入札型の下で履歴ログのキャンペーンパフォーマンスを統一的なリプレイアルゴリズムで再現する。
手法は、関連する予測指標間の混合キャリブレーションパターンをキャプチャして、推定結果を真にマッピングする。
論文 参考訳(メタデータ) (2022-02-24T03:04:29Z) - Sequential Information Design: Markov Persuasion Process and Its
Efficient Reinforcement Learning [156.5667417159582]
本稿では,逐次情報設計の新たなモデル,すなわちマルコフ説得過程(MPP)を提案する。
MPPのプランニングは、ミオピックレシーバーに同時に説得されるシグナルポリシーを見つけ、送信者の最適な長期累積ユーティリティを誘導する、というユニークな課題に直面している。
我々は,楽観主義と悲観主義の両原理の新たな組み合わせを特徴とする,実証可能な効率のよい非回帰学習アルゴリズム,Optimism-Pessimism Principle for Persuasion Process (OP4) を設計する。
論文 参考訳(メタデータ) (2022-02-22T05:41:43Z) - Bid Optimization using Maximum Entropy Reinforcement Learning [0.3149883354098941]
本稿では、リアルタイム入札(RTB)における強化学習(RL)を用いた広告主の入札戦略の最適化に焦点をあてる。
まず、広く受け入れられている線形入札関数を用いて、すべての印象のベース価格を計算し、RTBオークション環境から派生した可変調整係数で最適化する。
最後に、公開データセットに関する実証的研究により、提案した入札戦略がベースラインよりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-10-11T06:53:53Z) - A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in
Online Advertising [53.636153252400945]
本稿では,自動入札のための総合的マルチエージェント強化学習フレームワーク,すなわちMAABを提案し,自動入札戦略を学習する。
当社のアプローチは、社会的福祉の観点から、いくつかの基準的手法を上回り、広告プラットフォームの収益を保証します。
論文 参考訳(メタデータ) (2021-06-11T08:07:14Z) - Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential
Advertising [52.3825928886714]
我々は、動的knapsack問題として、シーケンシャルな広告戦略最適化を定式化する。
理論的に保証された二段階最適化フレームワークを提案し、元の最適化空間の解空間を大幅に削減する。
強化学習の探索効率を向上させるため,効果的な行動空間削減手法も考案した。
論文 参考訳(メタデータ) (2020-06-29T18:50:35Z) - Optimal Bidding Strategy without Exploration in Real-time Bidding [14.035270361462576]
予算制約によるユーティリティの最大化は、リアルタイム入札(RTB)システムにおける広告主の主要な目標である。
それまでの作品は、検閲された国家の困難を和らげるために競売に敗れたことを無視していた。
本稿では,リアルタイムトラフィックで観測される真の分布の挙動を模倣するために,最大エントロピー原理を用いた新しい実用的枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-31T20:43:28Z) - Online Joint Bid/Daily Budget Optimization of Internet Advertising
Campaigns [115.96295568115251]
複数のチャンネルにまたがるペイ・パー・クリック広告キャンペーンのオンライン共同入札/日次予算最適化の自動化問題について検討する。
どのキャンペーンでも、Gaussian Processesによる入札のクリック数と日々の予算に依存しています。
我々は4つのアルゴリズムを設計し、O(sqrtT)として高い確率で上界した後悔に苦しむことを示す。
我々は,1年以上に1日平均1000ユーロを消費した実世界のアプリケーションにおいて,我々のアルゴリズムの採用結果を提示する。
論文 参考訳(メタデータ) (2020-03-03T11:07:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。