論文の概要: Auto-bidding in real-time auctions via Oracle Imitation Learning
- arxiv url: http://arxiv.org/abs/2412.11434v1
- Date: Mon, 16 Dec 2024 04:21:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-17 14:00:19.242682
- Title: Auto-bidding in real-time auctions via Oracle Imitation Learning
- Title(参考訳): Oracle Imitation Learningによるリアルタイムオークションの自動入札
- Authors: Alberto Chiappa, Briti Gangopadhyay, Zhao Wang, Shingo Takamatsu,
- Abstract要約: マルチスロット第2価格オークションにおける自動入札エージェントのトレーニングフレームワークを提案する。
広告キャンペーンが終了すると、各インプレッション機会の最適入札を決定することは、複数の選択knapsack問題とみなすことができるという知見を活用できる。
本稿では,印象の機会と広告スロットをほぼ最適に組み合わせた「オークル」アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 7.82208912171303
- License:
- Abstract: Online advertising has become one of the most successful business models of the internet era. Impression opportunities are typically allocated through real-time auctions, where advertisers bid to secure advertisement slots. Deciding the best bid for an impression opportunity is challenging, due to the stochastic nature of user behavior and the variability of advertisement traffic over time. In this work, we propose a framework for training auto-bidding agents in multi-slot second-price auctions to maximize acquisitions (e.g., clicks, conversions) while adhering to budget and cost-per-acquisition (CPA) constraints. We exploit the insight that, after an advertisement campaign concludes, determining the optimal bids for each impression opportunity can be framed as a multiple-choice knapsack problem (MCKP) with a nonlinear objective. We propose an "oracle" algorithm that identifies a near-optimal combination of impression opportunities and advertisement slots, considering both past and future advertisement traffic data. This oracle solution serves as a training target for a student network which bids having access only to real-time information, a method we term Oracle Imitation Learning (OIL). Through numerical experiments, we demonstrate that OIL achieves superior performance compared to both online and offline reinforcement learning algorithms, offering improved sample efficiency. Notably, OIL shifts the complexity of training auto-bidding agents from crafting sophisticated learning algorithms to solving a nonlinear constrained optimization problem efficiently.
- Abstract(参考訳): オンライン広告はインターネット時代の最も成功したビジネスモデルの1つになった。
印象的な機会は通常、広告主が広告スロットを確保するために入札するリアルタイムオークションを通じて割り当てられる。
ユーザ行動の確率的な性質と広告トラフィックの時間的変動のため、印象的機会の最良の入札を決定することは困難である。
本研究では,マルチスロット第2価格オークションにおける自動入札エージェントのトレーニングフレームワークを提案し,買収(例えば,クリック,変換)を最大化するとともに,予算と費用対買収(CPA)の制約に固執する。
広告キャンペーンが終了すると、各インプレッション機会に対する最適な入札を決定することは、非線形目的を持つ多重選択クナップサック問題(MCKP)とみなすことができるという知見を利用する。
本研究では,過去の広告トラフィックデータと将来の広告トラフィックデータの両方を考慮し,印象の機会と広告スロットをほぼ最適に組み合わせた「おかしな」アルゴリズムを提案する。
このオラクルソリューションは,Oracle Imitation Learning (OIL) という,リアルタイム情報のみにアクセス可能な学生ネットワークのトレーニングターゲットとして機能する。
数値実験により,OILはオンラインおよびオフラインの強化学習アルゴリズムと比較して優れた性能を示し,サンプル効率が向上した。
特に、OILは、高度な学習アルゴリズムを製作することから、非線形に制約された最適化問題を効率的に解くことへ、自動入札エージェントの訓練の複雑さをシフトさせる。
関連論文リスト
- Procurement Auctions via Approximately Optimal Submodular Optimization [53.93943270902349]
競売業者がプライベートコストで戦略的売り手からサービスを取得しようとする競売について検討する。
我々の目標は、取得したサービスの品質と販売者の総コストとの差を最大化する計算効率の良いオークションを設計することである。
論文 参考訳(メタデータ) (2024-11-20T18:06:55Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Online Ad Procurement in Non-stationary Autobidding Worlds [10.871587311621974]
本稿では,複数次元決定変数,帯域幅フィードバック,長期不確実な制約を用いたオンライン意思決定のための原始双対アルゴリズムを提案する。
提案アルゴリズムは, 逆数, 逆数, 周期的, エルゴディックな手順により, 調達結果が生成されると, 多くの世界では, 後悔の度合いが低いことを示す。
論文 参考訳(メタデータ) (2023-07-10T00:41:08Z) - Adversarial Constrained Bidding via Minimax Regret Optimization with
Causality-Aware Reinforcement Learning [18.408964908248855]
既存の制限入札のアプローチは、典型的には列車と試験条件に依存している。
本研究では,教師が教師の学習環境を学習する環境と,学習者が与えられた環境分布に対してその方針をメタ学習する環境とをインターリーブする,Minimax Regret Optimization (MiRO) 手法を提案する。
因果性認識強化学習(MiROCL)を用いたMIROは,従来の手法よりも30%以上優れていた。
論文 参考訳(メタデータ) (2023-06-12T13:31:58Z) - OverPrompt: Enhancing ChatGPT through Efficient In-Context Learning [49.38867353135258]
複数のタスク入力を処理するために,LLMのコンテキスト内学習機能を活用したOverPromptを提案する。
本実験により,OverPromptはタスク性能を著しく損なうことなく,コスト効率の良いゼロショット分類を実現することができることがわかった。
論文 参考訳(メタデータ) (2023-05-24T10:08:04Z) - Improving Real-Time Bidding in Online Advertising Using Markov Decision
Processes and Machine Learning Techniques [0.0]
本稿では,ディープラーニングと強化学習を組み合わせたリアルタイム入札手法を提案する。
提案手法は,オークションの詳細と市場価格を予測するためのディープニューラルネットワークと,最適な入札価格を決定するための強化学習アルゴリズムを用いる。
その結果,提案手法は費用対効果と精度が好ましいことが示された。
論文 参考訳(メタデータ) (2023-05-05T14:34:20Z) - Learning to Bid Optimally and Efficiently in Adversarial First-price
Auctions [40.30925727499806]
我々は,$widetildeO(sqrtT)$ regretを達成する,最初のミニマックス最適オンライン入札アルゴリズムを開発した。
Verizon Mediaから得られた3つの実世界の1価オークションデータセットを用いて,本アルゴリズムを検証した。
論文 参考訳(メタデータ) (2020-07-09T05:40:39Z) - Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential
Advertising [52.3825928886714]
我々は、動的knapsack問題として、シーケンシャルな広告戦略最適化を定式化する。
理論的に保証された二段階最適化フレームワークを提案し、元の最適化空間の解空間を大幅に削減する。
強化学習の探索効率を向上させるため,効果的な行動空間削減手法も考案した。
論文 参考訳(メタデータ) (2020-06-29T18:50:35Z) - Online Joint Bid/Daily Budget Optimization of Internet Advertising
Campaigns [115.96295568115251]
複数のチャンネルにまたがるペイ・パー・クリック広告キャンペーンのオンライン共同入札/日次予算最適化の自動化問題について検討する。
どのキャンペーンでも、Gaussian Processesによる入札のクリック数と日々の予算に依存しています。
我々は4つのアルゴリズムを設計し、O(sqrtT)として高い確率で上界した後悔に苦しむことを示す。
我々は,1年以上に1日平均1000ユーロを消費した実世界のアプリケーションにおいて,我々のアルゴリズムの採用結果を提示する。
論文 参考訳(メタデータ) (2020-03-03T11:07:38Z) - MoTiAC: Multi-Objective Actor-Critics for Real-Time Bidding [47.555870679348416]
そこで本研究では,MoTiACというマルチエクティブ・アクタ・クリティカルスアルゴリズムを提案する。
従来のRLモデルとは異なり、提案されたMoTiACは複雑な入札環境で同時に多目的タスクを達成できる。
論文 参考訳(メタデータ) (2020-02-18T07:16:39Z) - Online Causal Inference for Advertising in Real-Time Bidding Auctions [1.9336815376402723]
本稿では,リアルタイム入札システムを通じて購入した広告に対する因果推論を行うための新しい手法を提案する。
まず、広告の効果が最適な入札によって識別されることを示す。
マルチアームバンディット問題を解くために,適応型トンプソンサンプリング(TS)アルゴリズムを導入する。
論文 参考訳(メタデータ) (2019-08-22T21:13:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。