論文の概要: Optimizing Online Advertising with Multi-Armed Bandits: Mitigating the Cold Start Problem under Auction Dynamics
- arxiv url: http://arxiv.org/abs/2502.01867v1
- Date: Mon, 03 Feb 2025 22:33:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:57:44.072250
- Title: Optimizing Online Advertising with Multi-Armed Bandits: Mitigating the Cold Start Problem under Auction Dynamics
- Title(参考訳): マルチアーマッドバンドによるオンライン広告の最適化--オークションダイナミクスによるコールドスタート問題の緩和
- Authors: Anastasiia Soboleva, Andrey Pudovikov, Roman Snetkov, Alina Babenko, Egor Samosvat, Yuriy Dorn,
- Abstract要約: 不十分な行動データ(クリック)は、新しい広告の正確なクリックスルー率予測を難しくする。
位置ベースモデルのためのマルチアーム・バンディット(MAB)設定下でUCBライクなアルゴリズムを開発する。
また,プラットフォームにおける長期的収益性の向上に加えて,短期的利益維持のメカニズムも提案する。
- 参考スコア(独自算出の注目度): 0.1759252234439348
- License:
- Abstract: Online advertising platforms often face a common challenge: the cold start problem. Insufficient behavioral data (clicks) makes accurate click-through rate (CTR) forecasting of new ads challenging. CTR for "old" items can also be significantly underestimated due to their early performance influencing their long-term behavior on the platform. The cold start problem has far-reaching implications for businesses, including missed long-term revenue opportunities. To mitigate this issue, we developed a UCB-like algorithm under multi-armed bandit (MAB) setting for positional-based model (PBM), specifically tailored to auction pay-per-click systems. Our proposed algorithm successfully combines theory and practice: we obtain theoretical upper estimates of budget regret, and conduct a series of experiments on synthetic and real-world data that confirm the applicability of the method on the real platform. In addition to increasing the platform's long-term profitability, we also propose a mechanism for maintaining short-term profits through controlled exploration and exploitation of items.
- Abstract(参考訳): オンライン広告プラットフォームは、コールドスタート問題という共通の課題に直面していることが多い。
不十分な行動データ(クリック)は、新しい広告の正確なクリックスルー率(CTR)を予測する。
古い”アイテムのCTRは、プラットフォーム上での長期的な振る舞いに影響を与える初期のパフォーマンスのために、かなり過小評価される可能性がある。
コールドスタートの問題は、長期的な収益機会の欠如など、企業にとって大きな影響をもたらしている。
この問題を緩和するため、我々はPBMのマルチアームバンディット(MAB)設定下でUPBライクなアルゴリズムを開発し、特にオークションペイ・パー・クリックシステムに特化させた。
提案アルゴリズムは, 提案手法を実プラットフォーム上で適用可能であることを示す合成および実世界のデータに対して, 理論的に上層推定値を得るとともに, 提案手法を実プラットフォーム上で適用可能であることを示す一連の実験を行う。
また,プラットフォームにおける長期的収益性の向上に加えて,アイテムの探索・活用による短期的利益維持のメカニズムも提案する。
関連論文リスト
- Online Learning in Contextual Second-Price Pay-Per-Click Auctions [47.06746975822902]
オンライン学習は、クリック単価のオークションで学習し、そこでは、各ラウンドのT$で、学習者がいくつかのコンテキストと広告を受信する。
学習者のゴールは、彼女の後悔を最小限に抑えることであり、それは彼女の総収入と託宣戦略のギャップとして定義される。
論文 参考訳(メタデータ) (2023-10-08T07:04:22Z) - Online Ad Procurement in Non-stationary Autobidding Worlds [10.871587311621974]
本稿では,複数次元決定変数,帯域幅フィードバック,長期不確実な制約を用いたオンライン意思決定のための原始双対アルゴリズムを提案する。
提案アルゴリズムは, 逆数, 逆数, 周期的, エルゴディックな手順により, 調達結果が生成されると, 多くの世界では, 後悔の度合いが低いことを示す。
論文 参考訳(メタデータ) (2023-07-10T00:41:08Z) - Online Bidding Algorithms for Return-on-Spend Constrained Advertisers [10.500109788348732]
この研究は、人気が高まっている制約の下で、単一の価値を最大化する広告主のための効率的なオンラインアルゴリズムを探索する。
我々は,指定したRoS制約を常に尊重しながら,期待のほぼ最適に後悔する簡単なオンラインアルゴリズムに貢献する。
論文 参考訳(メタデータ) (2022-08-29T16:49:24Z) - Approaching sales forecasting using recurrent neural networks and
transformers [57.43518732385863]
深層学習技術を用いて,日・店・店レベルでの顧客販売予測問題に対処する3つの方法を開発した。
実験結果から,データ前処理を最小限に抑えた単純なシーケンスアーキテクチャを用いて,優れた性能を実現することができることを示す。
提案した解は約0.54の RMSLE を達成し、Kaggle コンペティションで提案された問題に対する他のより具体的な解と競合する。
論文 参考訳(メタデータ) (2022-04-16T12:03:52Z) - Mitigating Divergence of Latent Factors via Dual Ascent for Low Latency
Event Prediction Models [0.739706777911384]
現実世界のコンテンツレコメンデーションマーケットプレースは、特定の振る舞いを示し、一般的な静的なオフラインデータセットでは必ずしも明らかでない制約によって課される。
本稿では,モデルの潜在ベクトルに対して,慎重に選択された制約セットを付与することにより,モデルパラメータのばらつきを防止する体系的手法を提案する。
我々は,分散インスタンス数の大幅な削減と,ユーザエクスペリエンスと収益の両面で大きな改善を示すオンライン実験を実施している。
論文 参考訳(メタデータ) (2021-11-15T16:09:48Z) - Exploration in Online Advertising Systems with Deep Uncertainty-Aware
Learning [26.24464382500032]
本稿では,クリックスルー率(CTR)予測モデルを学習するための新しいDeep Uncertainty-Aware Learning(DUAL)手法を提案する。
DUALは既存のモデルに簡単に実装でき、最小限の計算オーバーヘッドでリアルタイムシステムにデプロイできる。
また、広告システムにおける社会福祉等の長期的なユーティリティ向上戦略も提示する。
論文 参考訳(メタデータ) (2020-11-25T17:23:52Z) - Learning to Infer User Hidden States for Online Sequential Advertising [52.169666997331724]
本稿では,これらの問題に対処するディープインテントシーケンス広告(DISA)手法を提案する。
解釈可能性の鍵となる部分は、消費者の購入意図を理解することである。
論文 参考訳(メタデータ) (2020-09-03T05:12:26Z) - Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential
Advertising [52.3825928886714]
我々は、動的knapsack問題として、シーケンシャルな広告戦略最適化を定式化する。
理論的に保証された二段階最適化フレームワークを提案し、元の最適化空間の解空間を大幅に削減する。
強化学習の探索効率を向上させるため,効果的な行動空間削減手法も考案した。
論文 参考訳(メタデータ) (2020-06-29T18:50:35Z) - Optimal Bidding Strategy without Exploration in Real-time Bidding [14.035270361462576]
予算制約によるユーティリティの最大化は、リアルタイム入札(RTB)システムにおける広告主の主要な目標である。
それまでの作品は、検閲された国家の困難を和らげるために競売に敗れたことを無視していた。
本稿では,リアルタイムトラフィックで観測される真の分布の挙動を模倣するために,最大エントロピー原理を用いた新しい実用的枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-31T20:43:28Z) - Adversarial Attacks on Linear Contextual Bandits [87.08004581867537]
悪意のあるエージェントは、望ましい行動を実行するためにバンディットアルゴリズムを攻撃するインセンティブを持つ可能性がある。
悪意のあるエージェントは、線形コンテキストのバンドイットアルゴリズムに任意のアーム$T - o(T)$倍を$T$ステップで引き出すように強制することができる。
また,悪意のあるエージェントが単一コンテキストにおける帯域幅アルゴリズムの動作に影響を与えることに関心がある場合についても検討する。
論文 参考訳(メタデータ) (2020-02-10T15:04:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。