論文の概要: HiBid: A Cross-Channel Constrained Bidding System with Budget Allocation by Hierarchical Offline Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2312.17503v2
- Date: Tue, 20 Aug 2024 08:09:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-21 20:30:33.935752
- Title: HiBid: A Cross-Channel Constrained Bidding System with Budget Allocation by Hierarchical Offline Deep Reinforcement Learning
- Title(参考訳): HiBid:階層的オフライン深層強化学習による予算配分を伴うチャネル間拘束型入札システム
- Authors: Hao Wang, Bo Tang, Chi Harold Liu, Shangqin Mao, Jiahong Zhou, Zipeng Dai, Yaqi Sun, Qianlong Xie, Xingxing Wang, Dong Wang,
- Abstract要約: 階層型オフライン深層強化学習(DRL)フレームワーク「HiBid」を提案する。
HiBidは、非競争的な予算配分のための補助的損失を備えた高レベルプランナーで構成されている。
チャネル間CPC制約を満たすためにCPC誘導動作選択機構を導入する。
- 参考スコア(独自算出の注目度): 31.88174870851001
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online display advertising platforms service numerous advertisers by providing real-time bidding (RTB) for the scale of billions of ad requests every day. The bidding strategy handles ad requests cross multiple channels to maximize the number of clicks under the set financial constraints, i.e., total budget and cost-per-click (CPC), etc. Different from existing works mainly focusing on single channel bidding, we explicitly consider cross-channel constrained bidding with budget allocation. Specifically, we propose a hierarchical offline deep reinforcement learning (DRL) framework called ``HiBid'', consisted of a high-level planner equipped with auxiliary loss for non-competitive budget allocation, and a data augmentation enhanced low-level executor for adaptive bidding strategy in response to allocated budgets. Additionally, a CPC-guided action selection mechanism is introduced to satisfy the cross-channel CPC constraint. Through extensive experiments on both the large-scale log data and online A/B testing, we confirm that HiBid outperforms six baselines in terms of the number of clicks, CPC satisfactory ratio, and return-on-investment (ROI). We also deploy HiBid on Meituan advertising platform to already service tens of thousands of advertisers every day.
- Abstract(参考訳): オンラインディスプレイ広告プラットフォームは、毎日何十億もの広告要求に対してリアルタイム入札(RTB)を提供することで、多くの広告主にサービスを提供する。
入札戦略は、複数のチャンネルにまたがる広告要求を処理し、設定された金銭的制約、すなわち、総予算とクリック当たりコスト(CPC)などのクリック数を最大化する。
単一チャネル入札を主眼とする既存の作業と異なり、予算配分を伴うチャネル横断入札を明示的に検討する。
具体的には,非競争的予算配分のための補助的損失を備えた高レベルプランナと,割り当てられた予算に対応する適応入札戦略のためのデータ強化低レベル実行器からなる階層型オフライン深層強化学習(DRL)フレームワークを提案する。
さらに、チャネル間CPC制約を満たすために、CPC誘導動作選択機構を導入する。
大規模ログデータとオンラインA/Bテストの両方に関する広範な実験を通じて、HiBidはクリック数、CPC満足率、投資率(ROI)において6つのベースラインを上回っていることを確認した。
また、HiBid on Meituanの広告プラットホームも展開しており、すでに数万の広告主が毎日利用している。
関連論文リスト
- RTBAgent: A LLM-based Agent System for Real-Time Bidding [11.49782135521099]
リアルタイム入札(Real-Time Bidding, RTB)は、広告主がインプレッション機会に即座に競争入札を行うことを可能にする。
これらの課題に対処するため、RTBAgentは大規模言語モデル(LLM)に基づく最初のRTBエージェントシステムとして提案されている。
本稿では,RTBAgentが過去の決定やトランザクション記録をレビューできる2段階の意思決定プロセスとマルチメモリ検索機構を提案する。
論文 参考訳(メタデータ) (2025-02-02T13:10:15Z) - Offline Learning for Combinatorial Multi-armed Bandits [56.96242764723241]
Off-CMABはCMABの最初のオフライン学習フレームワークである。
Off-CMABは悲観的な報酬推定と解法を組み合わせる。
合成および実世界のデータセットの実験は、CLCBの優れた性能を強調している。
論文 参考訳(メタデータ) (2025-01-31T16:56:18Z) - An Adaptable Budget Planner for Enhancing Budget-Constrained Auto-Bidding in Online Advertising [28.4314408199823]
ABPlannerは、予算制約のある自動入札を改善するために設計された、数発の適応可能な予算プランナーである。
ABPlannerは全段階にわたって予算を割り当て、予算配分計画に基づいて低レベルの自動入札を行うことができる。
ABPlannerの適応性は、文脈内強化学習にインスパイアされたシーケンシャルな意思決定アプローチによって達成される。
論文 参考訳(メタデータ) (2025-01-26T08:00:23Z) - Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding [4.741091524027138]
リアルタイム入札(RTB)はオンライン広告エコシステムにおいて重要な役割を担っている。
従来の手法では、動的な予算配分問題を効果的に管理することはできない。
マルチチャネル入札最適化のための階層型マルチエージェント強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-26T05:26:30Z) - ACQ: A Unified Framework for Automated Programmatic Creativity in Online Advertising [30.584160762498655]
本稿では,広告クリエイティビティの自動作成と非活性化を実現するための2段階のフレームワークであるAutomated Creatives Quota (ACQ)を提案する。
ACQは複数の広告主にクリエイティビティ・クォータを動的に割り当て、広告プラットフォームの収益を最大化する。
論文 参考訳(メタデータ) (2024-12-09T03:00:57Z) - Multi-Platform Budget Management in Ad Markets with Non-IC Auctions [6.037383467521294]
オンライン広告市場では、予算に制約のある広告主は、様々なプラットフォームでのオークションで繰り返し入札することで、広告の配置を取得する。
予算制約がある場合、インセンティブに適合するかもしれない、あるいはそうでないかもしれない一連のオークションにおいて、入札を最適に行う戦略を提案する。
当社の戦略は、広告主が期待する予算制約を満たしつつ、オークション全体で期待される全ユーティリティを最大化する。
論文 参考訳(メタデータ) (2023-06-12T18:21:10Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in
Online Advertising [53.636153252400945]
本稿では,自動入札のための総合的マルチエージェント強化学習フレームワーク,すなわちMAABを提案し,自動入札戦略を学習する。
当社のアプローチは、社会的福祉の観点から、いくつかの基準的手法を上回り、広告プラットフォームの収益を保証します。
論文 参考訳(メタデータ) (2021-06-11T08:07:14Z) - Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential
Advertising [52.3825928886714]
我々は、動的knapsack問題として、シーケンシャルな広告戦略最適化を定式化する。
理論的に保証された二段階最適化フレームワークを提案し、元の最適化空間の解空間を大幅に削減する。
強化学習の探索効率を向上させるため,効果的な行動空間削減手法も考案した。
論文 参考訳(メタデータ) (2020-06-29T18:50:35Z) - Online Joint Bid/Daily Budget Optimization of Internet Advertising
Campaigns [115.96295568115251]
複数のチャンネルにまたがるペイ・パー・クリック広告キャンペーンのオンライン共同入札/日次予算最適化の自動化問題について検討する。
どのキャンペーンでも、Gaussian Processesによる入札のクリック数と日々の予算に依存しています。
我々は4つのアルゴリズムを設計し、O(sqrtT)として高い確率で上界した後悔に苦しむことを示す。
我々は,1年以上に1日平均1000ユーロを消費した実世界のアプリケーションにおいて,我々のアルゴリズムの採用結果を提示する。
論文 参考訳(メタデータ) (2020-03-03T11:07:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。