論文の概要: Guiding the Recommender: Information-Aware Auto-Bidding for Content Promotion
- arxiv url: http://arxiv.org/abs/2601.20422v1
- Date: Wed, 28 Jan 2026 09:29:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:06.877991
- Title: Guiding the Recommender: Information-Aware Auto-Bidding for Content Promotion
- Title(参考訳): 推薦者の指導:コンテンツ推進のための情報認識型自動入札
- Authors: Yumou Liu, Zhenzhe Zheng, Jiang Rong, Yao Hu, Fan Wu, Guihai Chen,
- Abstract要約: 我々は、短期的価値獲得と長期的モデル改善のバランスをとるために、コンテンツプロモーションを2目的最適化として再放送する。
シャドウ価格で予算を動的にペースするラグランジュ双対性に基づく2段階自動入札アルゴリズムを設計する。
我々は, 理論的保証, 複合目的物の単調な部分モジュラリティの証明, オンラインオークションにおけるサブ線形後悔, 予算実現可能性を提供する。
- 参考スコア(独自算出の注目度): 40.266873363445754
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern content platforms offer paid promotion to mitigate cold start by allocating exposure via auctions. Our empirical analysis reveals a counterintuitive flaw in this paradigm: while promotion rescues low-to-medium quality content, it can harm high-quality content by forcing exposure to suboptimal audiences, polluting engagement signals and downgrading future recommendation. We recast content promotion as a dual-objective optimization that balances short-term value acquisition with long-term model improvement. To make this tractable at bid time in content promotion, we introduce a decomposable surrogate objective, gradient coverage, and establish its formal connection to Fisher Information and optimal experimental design. We design a two-stage auto-bidding algorithm based on Lagrange duality that dynamically paces budget through a shadow price and optimizes impression-level bids using per-impression marginal utilities. To address missing labels at bid time, we propose a confidence-gated gradient heuristic, paired with a zeroth-order variant for black-box models that reliably estimates learning signals in real time. We provide theoretical guarantees, proving monotone submodularity of the composite objective, sublinear regret in online auction, and budget feasibility. Extensive offline experiments on synthetic and real-world datasets validate the framework: it outperforms baselines, achieves superior final AUC/LogLoss, adheres closely to budget targets, and remains effective when gradients are approximated zeroth-order. These results show that strategic, information-aware promotion can improve long-term model performance and organic outcomes beyond naive impression-maximization strategies.
- Abstract(参考訳): 現代のコンテンツプラットフォームは、オークションを通じて露出を割り当てることで、コールドスタートを緩和する有償プロモーションを提供している。
我々の経験的分析は、このパラダイムの直感的欠陥を明らかにしている: プロモーションは品質の低いコンテンツを救い出す一方で、最適でない聴衆への露出を強制し、エンゲージメントシグナルを汚染し、将来の推奨を低下させることによって、高品質なコンテンツに害を与えることができる。
我々は、短期的価値獲得と長期的モデル改善のバランスをとるために、コンテンツプロモーションを2目的最適化として再放送する。
コンテンツプロモーションにおける入札時にこれを抽出できるようにするため、分解可能なサロゲート目標、勾配範囲を導入し、漁獲情報と公式な関係を確立し、最適な実験設計を行う。
ラグランジュ双対性に基づく2段階自動入札アルゴリズムを設計し、影の価格で予算を動的にペースさせ、印象レベルの入札を圧縮ごとの限界ユーティリティを用いて最適化する。
提案手法は,信頼度の高い勾配ヒューリスティックをブラックボックスモデルのゼロ階変種と組み合わせて提案し,学習信号をリアルタイムに確実に推定する。
我々は, 理論的保証, 複合目的物の単調な部分モジュラリティの証明, オンラインオークションにおけるサブ線形後悔, 予算実現可能性を提供する。
ベースラインを上回り、最終的なAUC/LogLossを上回り、予算目標に密着し、勾配がゼロオーダーに近似された場合でも有効である。
これらの結果から,戦略的情報認識の促進は,印象最大化戦略を超越した,長期的モデル性能と有機的成果を向上する可能性が示唆された。
関連論文リスト
- Enhancing Generative Auto-bidding with Offline Reward Evaluation and Policy Search [24.02739832976663]
自動入札は、広告主がパフォーマンスを改善するための重要なツールである。
近年の進歩により、AIGB(AI-Generated Bidding)は、通常のオフライン強化学習(RL)ベースの自動入札法と比較して優れた性能を発揮することが示されている。
生成計画とポリシー最適化を統合した新しい手法であるAIGB-Pearlを提案する。
論文 参考訳(メタデータ) (2025-09-19T12:30:26Z) - Generative Bid Shading in Real-Time Bidding Advertising [7.7746704524695485]
本稿では,生成バイドシェーディング(GBS)をエンドツーエンド生成モデルとして紹介する。
これは、段階的に残差報酬モデルを取得することで比率を生成する自己回帰的アプローチを取り入れている。
Meitプラットフォーム上で毎日何十億もの入札リクエストを処理している。
論文 参考訳(メタデータ) (2025-08-06T03:34:49Z) - Learning to Bid in Non-Stationary Repeated First-Price Auctions [27.743710782882136]
第一価オークションはデジタル広告市場で大きな注目を集めている。
第一価格オークションにおける最適な入札戦略を決定することはより複雑である。
対戦者の最多入札の順序のクラスに対する動的後悔の最小最大最適評価法を提案する。
論文 参考訳(メタデータ) (2025-01-23T03:53:27Z) - Learning Recommender Systems with Soft Target: A Decoupled Perspective [49.83787742587449]
そこで本研究では,ソフトラベルを活用することで,目的を2つの側面として捉えるために,分離されたソフトラベル最適化フレームワークを提案する。
本稿では,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-09T04:20:15Z) - Structured Dynamic Pricing: Optimal Regret in a Global Shrinkage Model [50.06663781566795]
消費者の嗜好と価格感が時間とともに変化する動的モデルを考える。
我々は,モデルパラメータの順序を事前に把握している透視者と比較して,収益損失が予想される,後悔による動的価格政策の性能を計測する。
提案した政策の最適性を示すだけでなく,政策立案のためには,利用可能な構造情報を組み込むことが不可欠であることを示す。
論文 参考訳(メタデータ) (2023-03-28T00:23:23Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Reserve Price Optimization for First Price Auctions [14.18752189817994]
本研究では, 入札者のリザーブ・ショックに対する応答性の推定値に基づいて, リザーブ・プライスを適応的に更新し, 最適化する勾配に基づくアルゴリズムを提案する。
第一価格オークションにおける収益は、オンデマンドコンポーネントとエンフビジンコンポーネントに分解することができ、各コンポーネントのばらつきを低減する技術を導入することができる。
論文 参考訳(メタデータ) (2020-06-11T15:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。