論文の概要: SEGB: Self-Evolved Generative Bidding with Local Autoregressive Diffusion
- arxiv url: http://arxiv.org/abs/2602.22226v1
- Date: Wed, 31 Dec 2025 09:05:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 07:21:25.692081
- Title: SEGB: Self-Evolved Generative Bidding with Local Autoregressive Diffusion
- Title(参考訳): SEGB: 局所自己回帰拡散を伴う自己進化型ジェネレーションバイディング
- Authors: Yulong Gao, Wan Jiang, Mingzhe Cao, Xuepu Wang, Zeyu Pan, Haonan Yang, Ye Liu, Xin Yang,
- Abstract要約: Self-Evolved Generative Bidding (SEGB)は、積極的に計画し、完全にオフラインで洗練するフレームワークである。
SEGBはまず、各入札をガイドするために、もっともらしい短水平状態の状態を合成し、エージェントに決定的かつダイナミックな監視を提供する。
そして、外部の介入なしに優れた戦略を反復的に発見するために、価値誘導された政策改善を行う。
- 参考スコア(独自算出の注目度): 9.051746879211764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the realm of online advertising, automated bidding has become a pivotal tool, enabling advertisers to efficiently capture impression opportunities in real-time. Recently, generative auto-bidding has shown significant promise, offering innovative solutions for effective ad optimization. However, existing offline-trained generative policies lack the near-term foresight required for dynamic markets and usually depend on simulators or external experts for post-training improvement. To overcome these critical limitations, we propose Self-Evolved Generative Bidding (SEGB), a framework that plans proactively and refines itself entirely offline. SEGB first synthesizes plausible short-horizon future states to guide each bid, providing the agent with crucial, dynamic foresight. Crucially, it then performs value-guided policy refinement to iteratively discover superior strategies without any external intervention. This self-contained approach uniquely enables robust policy improvement from static data alone. Experiments on the AuctionNet benchmark and a large-scale A/B test validate our approach, demonstrating that SEGB significantly outperforms state-of-the-art baselines. In a large-scale online deployment, it delivered substantial business value, achieving a +10.19% increase in target cost, proving the effectiveness of our advanced planning and evolution paradigm.
- Abstract(参考訳): オンライン広告の分野では、自動入札が重要なツールとなり、広告主はリアルタイムでインプレッションの機会を効率的に捉えることができる。
近年、生成的自動入札は大きな可能性を秘めており、効果的な広告最適化のための革新的なソリューションを提供している。
しかし、既存のオフライン学習型生成ポリシーは、動的市場に必要な短期的な見通しを欠き、通常、訓練後の改善のためにシミュレータや外部の専門家に依存している。
これらの限界を克服するために、私たちは、積極的に計画し、完全にオフラインで洗練するフレームワークであるSelf-Evolved Generative Bidding (SEGB)を提案する。
SEGBはまず、各入札をガイドするために、もっともらしい短水平状態の状態を合成し、エージェントに決定的かつダイナミックな監視を提供する。
重要なことは、外部の介入なしに優れた戦略を反復的に発見するために、価値誘導された政策改善を行う。
この自己完結型アプローチは、静的データだけで堅牢なポリシー改善を可能にする。
AuctionNetベンチマークと大規模A/Bテストの実験により、SEGBが最先端のベースラインを著しく上回ることを示した。
大規模なオンラインデプロイメントでは、大きなビジネス価値を提供し、ターゲットコストを+10.19%増加させ、先進的な計画と進化のパラダイムの有効性を証明しました。
関連論文リスト
- Self-Correcting VLA: Online Action Refinement via Sparse World Imagination [55.982504915794514]
本稿では, 自己補正VLA (SC-VLA) を提案する。
SC-VLAは最先端のパフォーマンスを達成し、最高タスクスループットを16%削減し、最高パフォーマンスのベースラインよりも9%高い成功率を得る。
論文 参考訳(メタデータ) (2026-02-25T06:58:06Z) - A Unified Multi-Task Learning Framework for Generative Auto-Bidding with Validation-Aligned Optimization [51.27959658504722]
マルチタスク学習は、これらのタスクを共有表現を通じて共同でトレーニングするための、原則化されたフレームワークを提供する。
既存のマルチタスク最適化戦略は、主にトレーニングダイナミクスによって導かれ、不安定な入札環境ではよく一般化される。
本稿では,タスク毎のトレーニング勾配と保留有効度勾配のアライメントに基づいてタスク重みを適応的に割り当てる,バリデーション適応型マルチタスク最適化(VAMO)を提案する。
論文 参考訳(メタデータ) (2025-10-09T03:59:51Z) - Enhancing Generative Auto-bidding with Offline Reward Evaluation and Policy Search [24.02739832976663]
自動入札は、広告主がパフォーマンスを改善するための重要なツールである。
近年の進歩により、AIGB(AI-Generated Bidding)は、通常のオフライン強化学習(RL)ベースの自動入札法と比較して優れた性能を発揮することが示されている。
生成計画とポリシー最適化を統合した新しい手法であるAIGB-Pearlを提案する。
論文 参考訳(メタデータ) (2025-09-19T12:30:26Z) - Expert-Guided Diffusion Planner for Auto-Bidding [8.810433582977446]
本研究では,専門家の軌道誘導とスキップステップサンプリング戦略を統合した条件付き拡散モデリング手法を導入し,生成効率を向上する。
この方法の有効性は、オンラインA/Bテストにおける総合的なオフライン実験と統計的に重要な結果によって実証され、変換は11.29%増加し、ベースラインに対する収益は12.36%増加した。
論文 参考訳(メタデータ) (2025-08-12T07:23:51Z) - BAT: Benchmark for Auto-bidding Task [67.56067222427946]
本稿では,最も普及している2種類のオークション形式を含むオークションベンチマークを提案する。
我々は,新しいデータセットに基づいて,一連の堅牢なベースラインを実装した。
このベンチマークは、研究者や実践者が革新的なオートバイディングアルゴリズムを開発し、洗練するための、ユーザフレンドリで直感的なフレームワークを提供する。
論文 参考訳(メタデータ) (2025-05-13T12:12:34Z) - Generative Auto-Bidding with Value-Guided Explorations [47.71346722705783]
本稿では,GAVE(Value-Guided Explorations)を用いた新しいオフライン自動入札フレームワークを提案する。
2つのオフラインデータセットと実世界のデプロイに関する実験結果は、GAVEがオフライン評価とオンラインA/Bテストの両方で最先端のベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2025-04-20T12:28:49Z) - GAS: Generative Auto-bidding with Post-training Search [26.229396732360787]
本稿では,GASと呼ばれるポストトレーニング後検索を用いたフレキシブルで実用的な自動入札方式を提案し,基本方針モデルの出力を改良する。
実世界のデータセットとKuaishou広告プラットフォーム上でのオンラインA/Bテストによる実験は、GASの有効性を実証している。
論文 参考訳(メタデータ) (2024-12-22T13:47:46Z) - Offline Reinforcement Learning for Optimizing Production Bidding
Policies [1.8689461238197953]
生産環境における入札ポリシーを最適化するための一般化可能なアプローチを提案する。
任意のベースポリシとディープニューラルネットワークを組み合わせたハイブリッドエージェントアーキテクチャを使用します。
このようなアーキテクチャは,シミュレーションおよび大規模生産入札環境において,統計的に有意な性能向上を達成できることを実証する。
論文 参考訳(メタデータ) (2023-10-13T22:14:51Z) - Structured Dynamic Pricing: Optimal Regret in a Global Shrinkage Model [50.06663781566795]
消費者の嗜好と価格感が時間とともに変化する動的モデルを考える。
我々は,モデルパラメータの順序を事前に把握している透視者と比較して,収益損失が予想される,後悔による動的価格政策の性能を計測する。
提案した政策の最適性を示すだけでなく,政策立案のためには,利用可能な構造情報を組み込むことが不可欠であることを示す。
論文 参考訳(メタデータ) (2023-03-28T00:23:23Z) - Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential
Advertising [52.3825928886714]
我々は、動的knapsack問題として、シーケンシャルな広告戦略最適化を定式化する。
理論的に保証された二段階最適化フレームワークを提案し、元の最適化空間の解空間を大幅に削減する。
強化学習の探索効率を向上させるため,効果的な行動空間削減手法も考案した。
論文 参考訳(メタデータ) (2020-06-29T18:50:35Z) - Optimal Bidding Strategy without Exploration in Real-time Bidding [14.035270361462576]
予算制約によるユーティリティの最大化は、リアルタイム入札(RTB)システムにおける広告主の主要な目標である。
それまでの作品は、検閲された国家の困難を和らげるために競売に敗れたことを無視していた。
本稿では,リアルタイムトラフィックで観測される真の分布の挙動を模倣するために,最大エントロピー原理を用いた新しい実用的枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-31T20:43:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。