論文の概要: Generative Click-through Rate Prediction with Applications to Search Advertising
- arxiv url: http://arxiv.org/abs/2507.11246v1
- Date: Tue, 15 Jul 2025 12:21:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:03.103139
- Title: Generative Click-through Rate Prediction with Applications to Search Advertising
- Title(参考訳): クリックスルー生成率予測と検索広告への応用
- Authors: Lingwei Kong, Lu Wang, Changping Peng, Zhangang Lin, Ching Law, Jingping Shao,
- Abstract要約: 識別モデルにおけるCTR予測の精度を高めるために生成モデルを利用する新しいモデルを提案する。
提案手法の有効性は,新しいデータセットに対する広範囲な実験を通じて実証される。
このモデルは、世界最大のeコマースプラットフォームのひとつにデプロイされている。
- 参考スコア(独自算出の注目度): 6.555660969349762
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Click-Through Rate (CTR) prediction models are integral to a myriad of industrial settings, such as personalized search advertising. Current methods typically involve feature extraction from users' historical behavior sequences combined with product information, feeding into a discriminative model that is trained on user feedback to estimate CTR. With the success of models such as GPT, the potential for generative models to enrich expressive power beyond discriminative models has become apparent. In light of this, we introduce a novel model that leverages generative models to enhance the precision of CTR predictions in discriminative models. To reconcile the disparate data aggregation needs of both model types, we design a two-stage training process: 1) Generative pre-training for next-item prediction with the given item category in user behavior sequences; 2) Fine-tuning the well-trained generative model within a discriminative CTR prediction framework. Our method's efficacy is substantiated through extensive experiments on a new dataset, and its significant utility is further corroborated by online A/B testing results. Currently, the model is deployed on one of the world's largest e-commerce platforms, and we intend to release the associated code and dataset in the future.
- Abstract(参考訳): CTR(Click-Through Rate)予測モデルは、パーソナライズされた検索広告のような、無数の産業環境に不可欠なモデルである。
現在の手法では、ユーザの履歴行動シーケンスから製品情報と組み合わせて特徴抽出を行い、CTRを推定するためにユーザのフィードバックに基づいて訓練された識別モデルに入力する。
GPTのようなモデルの成功により、識別モデルを超えて表現力を豊かにする生成モデルの可能性が明らかになってきた。
そこで本研究では,識別モデルにおけるCTR予測の精度を高めるために生成モデルを活用する新しいモデルを提案する。
両モデルの異なるデータアグリゲーションニーズを整理するために、2段階のトレーニングプロセスを設計する。
1) ユーザの行動系列における所定の項目カテゴリーによる次点予測のための生成事前学習
2) 識別的CTR予測枠組みにおけるよく訓練された生成モデルを微調整する。
提案手法の有効性は,新たなデータセットの広範な実験を通じて実証され,オンラインA/Bテストの結果によってさらに裏付けられている。
現在、このモデルは世界最大のEコマースプラットフォームのひとつにデプロイされており、将来は関連するコードとデータセットをリリースする予定です。
関連論文リスト
- Unidentified and Confounded? Understanding Two-Tower Models for Unbiased Learning to Rank [50.9530591265324]
良好な性能のプロダクションシステムによって収集されたクリックで2towerモデルをトレーニングすると、ランキング性能が低下する。
理論的には、2towerモデルの識別可能性条件を解析し、クリックからモデルパラメータを復元するために、文書の入れ替わりや重複する特徴分布が必要であることを示す。
また,ログポリシが2towerモデルに与える影響についても検討し,モデルがユーザの動作を完全に捉えている場合,バイアスが発生しないことを見出した。
論文 参考訳(メタデータ) (2025-06-25T14:47:43Z) - Exploring Training and Inference Scaling Laws in Generative Retrieval [50.82554729023865]
生成検索は、検索を自己回帰生成タスクとして再構成し、大きな言語モデルがクエリから直接ターゲット文書を生成する。
生成的検索におけるトレーニングと推論のスケーリング法則を体系的に検討し,モデルのサイズ,トレーニングデータスケール,推論時間計算が協調的に性能に与える影響について検討した。
論文 参考訳(メタデータ) (2025-03-24T17:59:03Z) - An accuracy improving method for advertising click through rate prediction based on enhanced xDeepFM model [0.0]
本稿では,xDeepFMアーキテクチャに基づく改良型CTR予測モデルを提案する。
マルチヘッド・アテンション・メカニズムを統合することで、モデルは機能相互作用の異なる側面に同時に焦点を合わせることができる。
Criteoデータセットの実験結果は、提案モデルが他の最先端手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-11-21T03:21:29Z) - A Collaborative Ensemble Framework for CTR Prediction [73.59868761656317]
我々は、複数の異なるモデルを活用するための新しいフレームワーク、CETNet(Collaborative Ensemble Training Network)を提案する。
ナイーブなモデルスケーリングとは違って,私たちのアプローチは,共同学習による多様性とコラボレーションを重視しています。
当社のフレームワークは,Metaの3つのパブリックデータセットと大規模産業データセットに基づいて検証する。
論文 参考訳(メタデータ) (2024-11-20T20:38:56Z) - What's New in My Data? Novelty Exploration via Contrastive Generation [31.33791825286853]
創成による新規発見の課題(CGE)について紹介する。
CGEは、これらの特性を示す例を生成することによって、微調整データセットの新たな特性を特定することを目的としている。
本実験では,CGEが有害な言語や新しい自然言語,プログラミング言語などの新規なコンテンツの検出に有効であることを実証した。
論文 参考訳(メタデータ) (2024-10-18T15:24:05Z) - ReAugment: Model Zoo-Guided RL for Few-Shot Time Series Augmentation and Forecasting [74.00765474305288]
本稿では,時系列データ拡張のための強化学習(RL)の試験的検討を行う。
我々の手法であるReAugmentは、トレーニングセットのどの部分が拡張されるべきか、どのように拡張を行うべきか、RLがプロセスにどのような利点をもたらすのか、という3つの重要な問題に取り組む。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - A Two-Phase Recall-and-Select Framework for Fast Model Selection [13.385915962994806]
本稿では,2相モデル選択フレームワークを提案する。
これは、ベンチマークデータセット上でモデルのトレーニングパフォーマンスを活用することにより、堅牢なモデルを選択する効率を高めることを目的としている。
提案手法は,従来のベースライン法に比べて約3倍の速度でハイパフォーマンスモデルの選択を容易にすることが実証された。
論文 参考訳(メタデータ) (2024-03-28T14:44:44Z) - MAP: A Model-agnostic Pretraining Framework for Click-through Rate
Prediction [39.48740397029264]
本稿では,多分野分類データに特徴的破損と回復を適用したMAP(Model-Agnostic Pretraining)フレームワークを提案する。
マスク付き特徴予測(RFD)と代替特徴検出(RFD)の2つの実用的なアルゴリズムを導出する。
論文 参考訳(メタデータ) (2023-08-03T12:55:55Z) - Representer Point Selection for Explaining Regularized High-dimensional
Models [105.75758452952357]
本稿では,高次元表現器と呼ぶサンプルベース説明のクラスを紹介する。
私たちのワークホースは、一般化された高次元モデルに対する新しい代表者定理である。
提案手法の実証的性能について,実世界の2進分類データセットと2つの推薦システムデータセットを用いて検討した。
論文 参考訳(メタデータ) (2023-05-31T16:23:58Z) - Precision-Recall Divergence Optimization for Generative Modeling with
GANs and Normalizing Flows [54.050498411883495]
本研究では,ジェネレーティブ・アドバイサル・ネットワークや正規化フローなどの生成モデルのための新しいトレーニング手法を開発した。
指定された精度-リコールトレードオフを達成することは、textitPR-divergencesと呼ぶ家族からのユニークな$f$-divergenceを最小化することを意味する。
当社のアプローチは,ImageNetなどのデータセットでテストした場合の精度とリコールの両面で,BigGANのような既存の最先端モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-05-30T10:07:17Z) - GMValuator: Similarity-based Data Valuation for Generative Models [41.76259565672285]
生成モデル評価器(GMValuator, Generative Model Valuator, GMValuator, GMValuator)は、画像生成タスクにデータバリュエーションを提供するための、トレーニング不要で、モデルに依存しない最初のアプローチである。
GMValuatorは、その有効性を示すために、ベンチマークと高解像度データセットで広範囲に評価されている。
論文 参考訳(メタデータ) (2023-04-21T02:02:02Z) - Heterogeneous Network Embedding for Deep Semantic Relevance Match in
E-commerce Search [29.881612817309716]
Eコマースアイテム関連性のためのエンドツーエンドの第一次および第二次関連性予測モデルを設計します。
BERTから生成された外部知識を導入し,ユーザ行動のネットワークを改良する。
オフライン実験の結果,新しいモデルにより,人間関係判定における予測精度が有意に向上した。
論文 参考訳(メタデータ) (2021-01-13T03:12:53Z) - VAE-LIME: Deep Generative Model Based Approach for Local Data-Driven
Model Interpretability Applied to the Ironmaking Industry [70.10343492784465]
モデル予測だけでなく、その解釈可能性も、プロセスエンジニアに公開する必要があります。
LIMEに基づくモデルに依存しない局所的解釈可能性ソリューションが最近出現し、元の手法が改良された。
本稿では, 燃焼炉で生成する高温金属の温度を推定するデータ駆動型モデルの局所的解釈可能性に関する新しいアプローチ, VAE-LIMEを提案する。
論文 参考訳(メタデータ) (2020-07-15T07:07:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。