論文の概要: Generative Large-Scale Pre-trained Models for Automated Ad Bidding Optimization
- arxiv url: http://arxiv.org/abs/2508.02002v1
- Date: Mon, 04 Aug 2025 02:46:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.151223
- Title: Generative Large-Scale Pre-trained Models for Automated Ad Bidding Optimization
- Title(参考訳): 自動広告入札最適化のための大規模事前学習モデル
- Authors: Yu Lei, Jiayang Zhao, Yilei Zhao, Zhaoqi Zhang, Linyou Cai, Qianlong Xie, Xingxing Wang,
- Abstract要約: GRAD(Generative Reward-driven Ad-bidding with Mixture-of-Experts)を提案する。
GRADはプラットフォーム収益を大幅に向上させ、現代の広告主の進化的かつ多様な要求に対処する上での有効性を強調した。
- 参考スコア(独自算出の注目度): 5.460538555236247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern auto-bidding systems are required to balance overall performance with diverse advertiser goals and real-world constraints, reflecting the dynamic and evolving needs of the industry. Recent advances in conditional generative models, such as transformers and diffusers, have enabled direct trajectory generation tailored to advertiser preferences, offering a promising alternative to traditional Markov Decision Process-based methods. However, these generative methods face significant challenges, such as the distribution shift between offline and online environments, limited exploration of the action space, and the necessity to meet constraints like marginal Cost-per-Mille (CPM) and Return on Investment (ROI). To tackle these challenges, we propose GRAD (Generative Reward-driven Ad-bidding with Mixture-of-Experts), a scalable foundation model for auto-bidding that combines an Action-Mixture-of-Experts module for diverse bidding action exploration with the Value Estimator of Causal Transformer for constraint-aware optimization. Extensive offline and online experiments demonstrate that GRAD significantly enhances platform revenue, highlighting its effectiveness in addressing the evolving and diverse requirements of modern advertisers. Furthermore, GRAD has been implemented in multiple marketing scenarios at Meituan, one of the world's largest online food delivery platforms, leading to a 2.18% increase in Gross Merchandise Value (GMV) and 10.68% increase in ROI.
- Abstract(参考訳): 現代の自動入札システムは、産業のダイナミックで進化するニーズを反映して、様々な広告主の目標や現実の制約と全体的なパフォーマンスをバランスさせることが求められている。
トランスフォーマーやディフューザのような条件付き生成モデルの最近の進歩は、広告主の好みに合わせた直接軌跡生成を可能にし、従来のマルコフ決定プロセスに基づく手法に代わる有望な代替手段を提供する。
しかし、これらの生成手法は、オフライン環境とオンライン環境の分配シフト、行動空間の限られた探索、限界費用対ミール(CPM)や投資収益(ROI)といった制約を満たす必要性など、重大な課題に直面している。
これらの課題に対処するため,我々は,多種多様な入札行動探索のためのAction-Mixture-of-Expertsモジュールと制約対応最適化のためのCausal TransformerのValue Estimatorを組み合わせた,自動入札のためのスケーラブルな基盤モデルであるGRADを提案する。
大規模なオフラインおよびオンライン実験は、GRADがプラットフォーム収益を著しく向上させ、現代の広告主の進化的かつ多様な要求に対処する効果を強調していることを示している。
さらに、GRADは世界最大のオンラインフードデリバリープラットフォームであるMeituanで複数のマーケティングシナリオで実装されており、Gross Merchandise Value(GMV)が2.18%、ROIが10.68%増加した。
関連論文リスト
- HALO: Hindsight-Augmented Learning for Online Auto-Bidding [2.9058410231275014]
デジタル広告プラットフォームはリアルタイム入札(RTB)システムを通じてミリ秒レベルのオークションを運営している。
このダイナミックなメカニズムは、正確なオーディエンスターゲティングを可能にするが、深い運用上の複雑さをもたらす。
HALO: オンライン自動入札のための隠れた学習法を提案する。
論文 参考訳(メタデータ) (2025-08-05T09:47:26Z) - Multi-task Offline Reinforcement Learning for Online Advertising in Recommender Systems [54.709976343045824]
現在のオフライン強化学習(RL)手法は、スパース広告シナリオに適用した場合、重大な課題に直面している。
MTORLは,2つの主要な目標を対象とする,新しいマルチタスクオフラインRLモデルである。
我々はマルチタスク学習を用いて行動と報酬をデコードし、同時にチャネルレコメンデーションと予算配分に対処する。
論文 参考訳(メタデータ) (2025-06-29T05:05:13Z) - The Real Barrier to LLM Agent Usability is Agentic ROI [110.31127571114635]
大規模言語モデル(LLM)エージェントは、人間とAIの相互作用において有望な変化を示す。
我々は、需要の高いマスマーケットアプリケーションにおいて、重要なユーザビリティギャップを強調します。
論文 参考訳(メタデータ) (2025-05-23T11:40:58Z) - EGA-V2: An End-to-end Generative Framework for Industrial Advertising [19.927005856735445]
EGA-V2(End-to-End Generative Advertising)は、ユーザ興味、POI(point-of-interest)、クリエイティブジェネレーション、広告アロケーション、支払い最適化を体系的にモデル化する最初の統合フレームワークである。
当社の結果は、次世代産業広告システムへの道を開く、完全生成型広告ソリューションのパイオニアとしての可能性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-05-23T06:55:02Z) - WebEvolver: Enhancing Web Agent Self-Improvement with Coevolving World Model [55.276852838877346]
自己進化型エージェントは、独自のポリシーに基づいて、自律的にサンプリングされた軌道上で訓練される。
我々は,共進化型世界モデルLLMを導入する新しいフレームワークを提案する。
この世界モデルは、Web環境における現在の観察と行動に基づいて、次の観測を予測します。
論文 参考訳(メタデータ) (2025-04-23T02:54:31Z) - External Large Foundation Model: How to Efficiently Serve Trillions of Parameters for Online Ads Recommendation [58.49335224405165]
広告推薦はオンライン広告システムの顕著なサービスであり、積極的に研究されている。
近年の研究では、レコメンデーションモデルのスケールアップと高度な設計が、大幅な性能向上をもたらすことが示されている。
しかし、モデルスケールが大きくなるにつれて、従来の研究は産業規模での2つの基本的な課題を無視することが多いため、産業とのギャップが著しく増大する。
論文 参考訳(メタデータ) (2025-02-20T22:35:52Z) - GAS: Generative Auto-bidding with Post-training Search [26.229396732360787]
本稿では,GASと呼ばれるポストトレーニング後検索を用いたフレキシブルで実用的な自動入札方式を提案し,基本方針モデルの出力を改良する。
実世界のデータセットとKuaishou広告プラットフォーム上でのオンラインA/Bテストによる実験は、GASの有効性を実証している。
論文 参考訳(メタデータ) (2024-12-22T13:47:46Z) - AIGB: Generative Auto-bidding via Conditional Diffusion Modeling [26.283427427408085]
本稿では,AIGB(AI-Generated Bidding)について紹介する。
このパラダイムでは、入札生成のための条件付き拡散モデルであるDiffBidを提案する。
Alibabaの広告プラットフォーム上で、実世界のデータセットとオンラインA/Bテストで実施された実験は、DiffBidの有効性を実証している。
論文 参考訳(メタデータ) (2024-05-25T09:21:43Z) - Refined Mechanism Design for Approximately Structured Priors via Active
Regression [50.71772232237571]
我々は、大量の商品を戦略的入札者に販売する収益を最大化する販売業者の問題を考える。
この設定の最適かつほぼ最適のメカニズムは、特徴付けや計算が難しいことで有名である。
論文 参考訳(メタデータ) (2023-10-11T20:34:17Z) - ROI Constrained Bidding via Curriculum-Guided Bayesian Reinforcement
Learning [34.82004227655201]
非定常市場におけるROI制約入札を専門とする。
部分観測可能な制約付きマルコフ決定プロセスに基づいて,非単調な制約を満たすための最初のハードバリアソリューションを提案する。
本手法は,パラメータフリーなインジケータ強化報酬関数を利用して,カリキュラムガイドベイズ強化学習フレームワークを開発する。
論文 参考訳(メタデータ) (2022-06-10T17:30:12Z) - MoTiAC: Multi-Objective Actor-Critics for Real-Time Bidding [47.555870679348416]
そこで本研究では,MoTiACというマルチエクティブ・アクタ・クリティカルスアルゴリズムを提案する。
従来のRLモデルとは異なり、提案されたMoTiACは複雑な入札環境で同時に多目的タスクを達成できる。
論文 参考訳(メタデータ) (2020-02-18T07:16:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。